Maskinlæring kan fortelle deg hvilken utvikler som skrev hvilken kode, med 95% nøyaktighet

Det som trengs for å bygge et solid team av programvareutviklere David Galownia, administrerende direktør og president for Slingshot, forklarer hvordan økningen av skytjenester og den økende betydningen av UX- og UI-design har endret arbeidsstyrken og ferdighetene hans Louisville-baserte programvareutviklingsfirma trenger å lykkes.

Maskinlæring kan brukes til å av anonymisere spesifikke kodeprøver med en nøyaktighetsgrad på 90-95%, ifølge ny forskning fra Drexel Universitys Rachel Greenstadt og George Washington Universitys Aylin Caliskan.

Som nevnt i en rapport fra Wired, presenterte forskerparet sine funn på DefCon sikkerhetskonferanse i 2018 i Las Vegas. Å bruke maskinlæring for å finne ut hvem som skrev et gitt stykke kode, kan hjelpe med copyright-tvister, men det kan også ha noen personvernkonsekvenser, opplyser Wired-rapporten.

Verktøyet fungerer ved å bruke noen av prinsippene for stilometri - den analytiske metoden for å studere ens språklige stil. Brukt på kode, bemerket rapporten, kan den finne fingeravtrykket en utvikler kan ha etterlatt seg i arbeidet sitt.

Algoritmen som ble opprettet ser på omtrent 50 forskjellige funksjoner for å matche en gitt kodeeksempel til en bestemt utvikler. Naturligvis må det trene på eksempler på den spesifikke utviklerens kode også, nevnte rapporten.

Forskerne har jobbet med denne typen algoritmer en stund. I 2017 publiserte de et papir om arbeidet sitt (inkludert innspill fra andre forskere) som viste hvordan du bare trenger små kodefragmenter for å av anonymisere kode og matche den til en utvikler.

I tillegg, bemerket Wired-rapporten, var det en annen artikkel publisert av forskerne som forklarte hvordan programmerere kunne av-anonymiseres ved å bruke bare den kompilerte binære koden. I så fall klarte de å dekompilere koden tilbake til C ++ og deretter analysere den.

Så, hva er konsekvensene av dette arbeidet? Som nevnt, kan det brukes i tilfelle mistanke om plagiering eller brudd på opphavsretten, eller for å fortelle hvem som opprettet et bestemt malware-verktøy. Rapporten bemerket, men den kan også brukes til å finne ut hvem som bidrar til et gitt open source-prosjekt, eller hvem som kan bygge et verktøy for å omgå bestemte regjeringssensur eller prosesser, bemerket rapporten.

Interessant er at erfarne utviklere er lettere å oppdage enn nybegynnere - mest på grunn av den unike stilen de tar opp når de går sammen i karrieren. Kodeprøver som adresserte vanskelige problemer var også lettere å av anonymisere (85% suksessrate), sammenlignet med de for enkle problemer (90% suksessrate), heter det i rapporten. Forskerne kunne også skille mellom utviklere fra forskjellige land.

De store takeawayene for teknologiledere:

  • Forskere har utviklet en maskinlæringsalgoritme som kan av anonymisere kode for å finne ut hva utvikleren skrev den.
  • Mer erfarne utviklere er lettere å av anonymisere enn nybegynnere, på grunn av deres unike stil.

Tekniske nyheter du kan bruke nyhetsbrev

Vi leverer de nyeste teknologiske nyhetshistoriene om selskapene, menneskene og produktene som revolusjonerer planeten. Leveres daglig

Registrer deg i dag

© Copyright 2020 | mobilegn.com