Canonical a anunțat zilele astea un proiect nou pentru Ubuntu 26.10 (Stonking Stingray) care mi-a atras atenția - se numește Myna și este un instrument de dictare locală, adică transcriere din voce în text, care va fi integrat direct în desktop-ul Ubuntu.
Numele vine de la o pasăre tropicală cunoscută pentru că imită vocea umană cu o precizie destul de surprinzătoare, ceea ce e o alegere poetică pentru un astfel de proiect. Practic, apeși o combinație de taste, vorbești, și textul apare direct în aplicația pe care o ai deschisă în acel moment, fără să fie nevoie să copiezi sau să lipești nimic.
Ce mi se pare interesant este că totul se întâmplă local, pe calculatorul tău, fără nicio conexiune la internet după ce modelul de recunoaștere vocală a fost descărcat o dată. Microfonul se activează doar când pornești dictarea și audio-ul este procesat în memorie, după care este șters - nimic nu ajunge pe serverele Canonical sau ale altcuiva. Asta e exact abordarea pe care aș vrea să o văd mai des în lumea Linux, mai ales acum când fiecare a doua funcție nouă înseamnă date trimise undeva în cloud.
Versiunea inițială, care va ajunge în Ubuntu 26.10, va fi destul de simplă intenționat - nu vine cu asistent vocal, nu controlează desktopul cu comenzi vocale, nu traduce și nu detectează automat limba. Potrivit echipei Canonical, scopul este unul singur și clar: dictare fiabilă pe desktop. Restul pot veni mai târziu, pe baza feedback-ului de la utilizatori.
Arhitectura este modulară, cu recunoașterea vocală separată de gestionarea dictării și de inserarea textului în aplicații, ceea ce înseamnă că în viitor ar putea fi extinsă fără să se refacă totul de la zero. Deocamdată ținta principală este GNOME pe Wayland, dar proiectul este gândit să poată suporta și alte medii de desktop pe viitor.
Linuxiac observă că aceasta face parte dintr-o mișcare mai largă a Canonical de a construi un desktop „context-aware” cu funcții de inteligență artificială locale, Myna fiind unul dintre primele lucruri concrete care ies din această viziune.
Nu știu dacă voi folosi personal dictarea vocală vreodată, sincer - prefer tastatura și o să rămân la ea, dar înțeleg că pentru accesibilitate sau pentru cei care scriu mult și vor să dea mâinile o pauză, o funcție ca asta integrată nativ și fără să trimită nimic în cloud este o veste bună. E mai bine decât să instalezi ceva terț care îți înregistrează vocea pe serverele altcuiva.

Comentarii