ΚΟΣΜΟΣ

Voice Engine: Η νέα εφαρμογή της OpenAI που μιμείται με επιτυχία την ανθρώπινη ομιλία

H OpenAI ανακοίνωσε τα πρώτα αποτελέσματα από τις δοκιμές μιας εφαρμογής που μπορεί να διαβάζει λέξεις δυνατά με πειστική ανθρώπινη φωνή – ξεπερνώντας ένα νέο σύνορο για την τεχνητή νοημοσύνη και αυξάνοντας το φάσμα των κινδύνων για fake news.

Η εταιρεία έδωσε στη δημοσιότητα τα πρώτα demo από μια μικρής κλίμακας προεπισκόπηση του μοντέλου μετατροπής κειμένου σε ομιλία, που ονομάζεται Voice Engine και το οποίο έχει διαθέσει σε 10 προγραμματιστές μέχρι στιγμής, ανακοίνωσε ο εκπρόσωπος της εταιρείας. Η OpenAI αποφάσισε να μην προχωρήσει σε ευρύτερη διάθεση της συγκεκριμένης εφαρμογής για την δημιουργία της οποίας είχε ενημερώσει τους δημοσιογράφους νωρίτερα αυτό το μήνα.

Ένας εκπρόσωπος της OpenAI είπε ότι η εταιρεία αποφάσισε να περιορίσει την κυκλοφορία της νέας της εφαρμογής μετά από σχόλια που έλαβε  από ενδιαφερόμενους φορείς, όπως υπεύθυνους χάραξης πολιτικής, ειδικούς του κλάδου, εκπαιδευτικούς και καλλιτέχνες. Η εταιρεία είχε αρχικά σχεδιάσει να διαθέσει το νέο της εργαλείο σε έως και 100 προγραμματιστές, σύμφωνα με την προηγούμενη ενημέρωση που είχε κάνει.

“Αναγνωρίζουμε ότι η παραγωγή ομιλίας που μοιάζει με τις φωνές των ανθρώπων ενέχει σοβαρούς κινδύνους, οι οποίοι είναι ιδιαίτερα σημαντικοί μέσα σε μια εκλογική χρονιά”, έγραψε η εταιρεία σε ανάρτηση στο blog της.  “Συνεργαζόμαστε με Αμερικανούς και διεθνείς κυβερνητικούς εταίρους, τα μέσα ενημέρωσης, την ψυχαγωγία, την εκπαίδευση, την κοινωνία των πολιτών και πέραν αυτής για να διασφαλίσουμε ότι ενσωματώνουμε τα σχόλιά τους καθώς χτίζουμε το μοντέλο μας”.

Οι κίνδυνοι

Υπενθυμίζεται ότι κάποιες τεχνολογίες τεχνητής νοημοσύνης έχουν ήδη χρησιμοποιηθεί για την παραποίηση φωνών. Τον Ιανουάριο, την προσοχή είχε τραβήξει  ένα ψεύτικο αλλά ρεαλιστικό τηλεφώνημα που υποτίθεται ότι ήταν από τον Πρόεδρο Τζο Μπάιντεν ο οποίος εμφανιζόταν να προτρέπει τους ψηφοφόρους στο Νιου Χάμσαϊρ να μην συμμετέχουν στις προκριματικές εκλογές – γεγονός που πυροδότησε φόβους για το τι θα μπορούσαν να κάνουν οι εφαρμογές της τεχνητής νοημοσύνης ενόψει των αμερικανικών προεδρικών εκλογών.

Σε αντίθεση με προηγούμενες προσπάθειες του OpenAI για τη δημιουργία περιεχομένου ήχου, η εφαρμογή Voice Engine μπορεί να δημιουργήσει ομιλία που ακούγεται σαν την πραγματική ομιλία του καθενός ατόμου, με τους συγκεκριμένους ρυθμούς και τους τόνους τους. Το μόνο που χρειάζεται το λογισμικό για να πετύχει το συγκεκριμένο αποτέλεσμα είναι 15 δευτερόλεπτα ηχογραφημένης ομιλίας ενός ομιλητή και με αυτό το υλικό είναι σε θέση να αναδημιουργεί τη φωνή του.

Bloomberg: 100% επιτυχία

Κατά τη διάρκεια μιας επίδειξης του εργαλείου, το πρακτορείο Bloomberg άκουσε ένα ηχητικό του Διευθύνοντος Συμβούλου της OpenAI, Σαμ Άλτμαν, που εξηγούσε με λίγα λόγια τη συγκεκριμένη τεχνολογία με μια φωνή που κανείς δεν μπορούσε να ξεχωρίσει από την πραγματική του ομιλία, αλλά ήταν εξ ολοκλήρου δημιουργημένη από την τεχνητή νοημοσύνη. 

“Εάν έχετε τη σωστή ρύθμιση ήχου, είναι βασικά μια φωνή ανθρώπινου διαμετρήματος”, δήλωσε ο Τζεφ Χάρις, επικεφαλής προϊόντων στην OpenAI. “Έχει  μια αρκετά εντυπωσιακή τεχνική ποιότητα.” 

Related posts

Η Ρωσία θα λάβει στρατιωτικο-τεχνικά μέτρα ως απάντηση στην ένταξη της Σουηδίας στο ΝΑΤΟ

timesadmin

Moderna: Ξεπέρασαν τις προβλέψεις τα αποτελέσματα τριμήνου

wp-needuser

Γαλλία-Γερμανία: Προωθούν το πρόγραμμα κατασκευής ενός κοινού άρματος μάχης

wp-needuser

Περού: Ενέκρινε νομοθεσία για την παραγραφή εγκλημάτων κατά της ανθρωπότητας

timesadmin

Ευρωκοινοβούλιο: Η Σερβία δεν τήρησε τις δεσμεύσεις της για ελεύθερες και δίκαιες εκλογές

timesadmin

Ο ΟΗΕ χαιρέτισε τον τερματισμό της κράτησης του Τζούλιαν Ασάνζ

wp-needuser