Internetul deschis se schimbă

Am citit recent un articol scris de Anil Dash, un om care urmărește internetul de zeci de ani, și care descrie o imagine destul de tristă: internetul deschis, cel pe care îl știm, ar fi pe cale să dispară, distrus tocmai de companiile care au câștigat cel mai mult de pe urma lui. Dash e îngrijorat de felul în care companiile AI iau conținut fără acordul autorilor, ignoră robots.txt, trec peste licențele open source și copleșesc proiectele conduse de voluntari cu contribuții false create automat.

Înțeleg de unde vine îngrijorarea lui, și o parte din ea e justificată, dar eu văd lucrurile puțin diferit.

AI-ul nu poate exista fără internetul deschis

Un lucru pe care mulți critici ai AI-ului îl trec cu vederea este că aceste instrumente nu pot fi construite și îmbunătățite dacă nu au de unde să învețe, iar tot ce au învățat vine, în mare parte, din ce au publicat oamenii liber pe internet de-a lungul anilor: articole, forumuri, cărți, imagini, înregistrări audio și video. Fără internetul deschis, fără Wikipedia, fără milioanele de texte și resurse pe care oamenii obișnuiți le-au pus la dispoziția tuturor, nu am fi ajuns unde suntem astăzi cu inteligența artificială, iar asta nu e un argument împotriva AI-ului.

Ceea ce e cu adevărat greșit nu e că modelele AI au învățat din conținut de pe internet, ci că unele companii care le-au construit nu au respectat regulile simple pe care internetul și le-a stabilit singur de-a lungul timpului.

robots.txt există de zeci de ani și are un rol clar: proprietarul unui sit poate să spună prin acest fișier ce roboți au voie să îi acceseze paginile și în ce condiții, iar toată lumea a respectat această înțelegere vreme îndelungată. Faptul că unele companii AI au ales să o ignore nu e o problemă tehnică, e o problemă de atitudine, și exact acest tip de comportament strică încrederea în întreg ecosistemul.

La fel de important e și subiectul surselor, și aici sunt pe deplin de acord: atunci când un instrument AI oferă o informație, ar trebui să și citeze sursele de unde a luat-o, nu neapărat pentru că legea o cere în toate cazurile, ci pentru că e corect față de cel care a creat acel conținut și pentru că îi dă utilizatorului posibilitatea să verifice singur, în loc să accepte orbește ce îi spune mașina. Un AI care citează sursele e mai cinstit și mai util decât unul care prezintă totul ca adevăr de netăgăduit.

Ce ar trebui să se schimbe

Nu cred că trebuie să punem frână AI-ului sau să îl tratăm ca pe un dușman al internetului deschis, dar cred că există câteva lucruri simple pe care companiile care construiesc aceste instrumente ar trebui să le respecte: să fie deschise în legătură cu ce date au folosit pentru a le antrena, să respecte robots.txt și licențele open source, să citeze sursele atunci când oferă informații luate din altă parte, și să nu trateze munca voluntarilor și a creatorilor independenți ca pe ceva gratuit pe care îl pot lua oricând, fără să întrebe pe nimeni.

Internetul deschis a trecut prin multe schimbări până acum și cred că poate trece și prin aceasta, atâta timp cât regulile de bun simț care l-au făcut să funcționeze sunt respectate și în lumea noilor tehnologii.

Internetul deschis se schimbă

AI-ul nu poate exista fără internetul deschis

Ce ar trebui să se schimbe

Ai scris despre articolul ăsta?

Comentarii

Comenzi rapide de la tastatură