ΚΟΣΜΟΣ

Voice Engine: Η νέα εφαρμογή της OpenAI που μιμείται με επιτυχία την ανθρώπινη ομιλία

H OpenAI ανακοίνωσε τα πρώτα αποτελέσματα από τις δοκιμές μιας εφαρμογής που μπορεί να διαβάζει λέξεις δυνατά με πειστική ανθρώπινη φωνή – ξεπερνώντας ένα νέο σύνορο για την τεχνητή νοημοσύνη και αυξάνοντας το φάσμα των κινδύνων για fake news.

Η εταιρεία έδωσε στη δημοσιότητα τα πρώτα demo από μια μικρής κλίμακας προεπισκόπηση του μοντέλου μετατροπής κειμένου σε ομιλία, που ονομάζεται Voice Engine και το οποίο έχει διαθέσει σε 10 προγραμματιστές μέχρι στιγμής, ανακοίνωσε ο εκπρόσωπος της εταιρείας. Η OpenAI αποφάσισε να μην προχωρήσει σε ευρύτερη διάθεση της συγκεκριμένης εφαρμογής για την δημιουργία της οποίας είχε ενημερώσει τους δημοσιογράφους νωρίτερα αυτό το μήνα.

Ένας εκπρόσωπος της OpenAI είπε ότι η εταιρεία αποφάσισε να περιορίσει την κυκλοφορία της νέας της εφαρμογής μετά από σχόλια που έλαβε  από ενδιαφερόμενους φορείς, όπως υπεύθυνους χάραξης πολιτικής, ειδικούς του κλάδου, εκπαιδευτικούς και καλλιτέχνες. Η εταιρεία είχε αρχικά σχεδιάσει να διαθέσει το νέο της εργαλείο σε έως και 100 προγραμματιστές, σύμφωνα με την προηγούμενη ενημέρωση που είχε κάνει.

“Αναγνωρίζουμε ότι η παραγωγή ομιλίας που μοιάζει με τις φωνές των ανθρώπων ενέχει σοβαρούς κινδύνους, οι οποίοι είναι ιδιαίτερα σημαντικοί μέσα σε μια εκλογική χρονιά”, έγραψε η εταιρεία σε ανάρτηση στο blog της.  “Συνεργαζόμαστε με Αμερικανούς και διεθνείς κυβερνητικούς εταίρους, τα μέσα ενημέρωσης, την ψυχαγωγία, την εκπαίδευση, την κοινωνία των πολιτών και πέραν αυτής για να διασφαλίσουμε ότι ενσωματώνουμε τα σχόλιά τους καθώς χτίζουμε το μοντέλο μας”.

Οι κίνδυνοι

Υπενθυμίζεται ότι κάποιες τεχνολογίες τεχνητής νοημοσύνης έχουν ήδη χρησιμοποιηθεί για την παραποίηση φωνών. Τον Ιανουάριο, την προσοχή είχε τραβήξει  ένα ψεύτικο αλλά ρεαλιστικό τηλεφώνημα που υποτίθεται ότι ήταν από τον Πρόεδρο Τζο Μπάιντεν ο οποίος εμφανιζόταν να προτρέπει τους ψηφοφόρους στο Νιου Χάμσαϊρ να μην συμμετέχουν στις προκριματικές εκλογές – γεγονός που πυροδότησε φόβους για το τι θα μπορούσαν να κάνουν οι εφαρμογές της τεχνητής νοημοσύνης ενόψει των αμερικανικών προεδρικών εκλογών.

Σε αντίθεση με προηγούμενες προσπάθειες του OpenAI για τη δημιουργία περιεχομένου ήχου, η εφαρμογή Voice Engine μπορεί να δημιουργήσει ομιλία που ακούγεται σαν την πραγματική ομιλία του καθενός ατόμου, με τους συγκεκριμένους ρυθμούς και τους τόνους τους. Το μόνο που χρειάζεται το λογισμικό για να πετύχει το συγκεκριμένο αποτέλεσμα είναι 15 δευτερόλεπτα ηχογραφημένης ομιλίας ενός ομιλητή και με αυτό το υλικό είναι σε θέση να αναδημιουργεί τη φωνή του.

Bloomberg: 100% επιτυχία

Κατά τη διάρκεια μιας επίδειξης του εργαλείου, το πρακτορείο Bloomberg άκουσε ένα ηχητικό του Διευθύνοντος Συμβούλου της OpenAI, Σαμ Άλτμαν, που εξηγούσε με λίγα λόγια τη συγκεκριμένη τεχνολογία με μια φωνή που κανείς δεν μπορούσε να ξεχωρίσει από την πραγματική του ομιλία, αλλά ήταν εξ ολοκλήρου δημιουργημένη από την τεχνητή νοημοσύνη. 

“Εάν έχετε τη σωστή ρύθμιση ήχου, είναι βασικά μια φωνή ανθρώπινου διαμετρήματος”, δήλωσε ο Τζεφ Χάρις, επικεφαλής προϊόντων στην OpenAI. “Έχει  μια αρκετά εντυπωσιακή τεχνική ποιότητα.” 

Related posts

Γάζα: Απέπλευσε από Κύπρο προς τον θύλακα αμερικανικό πλοίο με ανθρωπιστική βοήθεια

timesadmin

Όλαφ Σολτς: “Να στείλουμε μήνυμα ενότητας” ζήτησε ο καγκελάριος ενόψει της συνόδου κορυφής του ΝΑΤΟ

protothema.gr

Τουρκία: Κάνει “πακέτο” τους S-400 για να πάρει F-35

protothema.gr

Ιράν: Η επόμενη μέρα μετά το θάνατο του προέδρου Ραΐσι – Ο εσωτερικός διχασμός και οι διεθνείς προκλήσεις

protothema.gr

Στην Ελβετία ο Κυρ. Μητσοτάκης για τη διάσκεψη ειρήνης για την Ουκρανία

James Rollner

Λ. Μενδώνη: Πρόγραμμα έργων 60 εκατ. ευρώ στη Λακωνία από το Υπ. Πολιτισμού

protothema.gr