ቁልፍ መውሰጃዎች
- ሜታ ስሜትን በንግግር የሚገልጹ ፕሮግራሞችን ለመስራት AI እየተጠቀመ ነው።
- የኩባንያው AI ቡድን እንደ ሳቅ፣ ማዛጋት፣ ልቅሶ እና "ድንገተኛ ቺት-ቻት" ያሉ ገላጭ ድምጾችን በመቅረጽ በእውነተኛ ጊዜ እድገት ማድረጉን ተናግሯል።
- AI እንዲሁ በንግግር ማወቂያ ላይ ማሻሻያዎችን ለማድረግ ጥቅም ላይ ይውላል።
በቅርቡ ከአርቴፊሻል ኢንተለጀንስ (AI) ሃይል ጋር ከኮምፒዩተርዎ ጋር የበለጠ ተፈጥሯዊ ውይይት ማድረግ ይችሉ ይሆናል።
ሜታ በ AI የተፈጠሩ የንግግር ስርዓቶችን ለመፍጠር በሚያደርገው ጥረት ከፍተኛ መሻሻል ማድረጉን ተናግሯል። የኩባንያው AI ቡድን እንደ ሳቅ፣ ማዛጋት እና ጩኸት ያሉ ገላጭ ድምጾችን በመቅረጽ በእውነተኛ ጊዜ ከ"ድንገተኛ ቺት-ቻት" በተጨማሪ እድገቶችን ማድረጉን ተናግሯል።
"በማንኛውም ውይይት ሰዎች እንደ ቃላታዊ ያልሆኑ ምልክቶች ማለትም እንደ ቃላቶች፣ ስሜታዊ አገላለጾች፣ ለአፍታ ማቆም፣ ዘዬዎች፣ ዜማዎች - ሁሉም ለሰው ልጅ መስተጋብር ጠቃሚ ናቸው ሲል ቡድኑ በቅርቡ ባወጣው የብሎግ ልጥፍ ላይ ጽፏል።. ነገር ግን የዛሬዎቹ AI ሲስተሞች እነዚህን ሃብታሞች እና ገላጭ ምልክቶችን መያዝ አልቻሉም ምክንያቱም የሚማሩት ከፅሁፍ ፅሁፍ ብቻ ነው፣ ይህም የምንናገረውን ነገር ግን እንዴት እንደምንናገረው አይደለም።"
ብልጥ ንግግር
በብሎግ ልኡክ ጽሁፍ ላይ የሜታ አይአይ ቡድን በንግግር ውስጥ የቃል ያልሆኑ ምልክቶችን ለምሳሌ ድምጾችን፣ ስሜታዊ አገላለጾችን፣ ቆም ማለትን፣ ዘዬዎችን እና ሪትሞችን የመሳሰሉ የባህላዊ AI ስርዓቶች ውስንነቶችን ለማሸነፍ እየሰሩ መሆናቸውን ተናግሯል።.ስርዓቶቹ ከጽሑፍ ጽሁፍ ብቻ መማር ስለሚችሉ ወደ ኋላ ቀርተዋል።
ነገር ግን የሜታ ስራ ከቀደምት ጥረቶች ይለያል ምክንያቱም የኤአይኢ ሞዴሎቹ የንግግር ቋንቋን ሙሉ ተፈጥሮ ለመያዝ የተፈጥሮ ቋንቋ ማቀነባበሪያ ሞዴሎችን መጠቀም ይችላሉ። የሜታ ተመራማሪዎች አዲሶቹ ሞዴሎች የኤአይአይ ሲስተሞች ማስተላለፍ የሚፈልጓቸውን እንደ መሰልቸት ወይም ምፀት ያሉ ስሜቶችን እንዲያስተላልፉ ያስችላቸዋል።
"በቅርብ ጊዜ ውስጥ፣ እንደ የጥያቄ መልስ (ለምሳሌ፣ "እንዴት ነው) ከሀብት ጋር የተያያዙ የጽሑፍ መለያዎችን ወይም አውቶማቲክ የንግግር ማወቂያ ሲስተሞች (ASR) ሳያስፈልጋቸው ጠቃሚ የታችኛው ተፋሰስ አፕሊኬሽኖችን ለመገንባት ጽሑፍ አልባ ቴክኒኮችን በመተግበር ላይ እናተኩራለን። የአየር ሁኔታ?"), "ቡድኑ በብሎግ ልጥፍ ላይ ጽፏል. "በንግግር ውስጥ ፕሮሶዲ አንድን ዓረፍተ ነገር በተሻለ ሁኔታ ለመተንተን ይረዳል ብለን እናምናለን ይህም በተራው ደግሞ ዓላማውን ለመረዳት እና የጥያቄዎችን መልስ አፈጻጸም ያሻሽላል."
የAI ሃይሎች ግንዛቤ
ኮምፒውተሮች በመግባቢያ ትርጉማቸው መሻሻል ብቻ ሳይሆን AI በንግግር ማወቂያ ላይ ማሻሻያዎችን ለማድረግ ጥቅም ላይ እየዋለ ነው።
የኮምፒውተር ሳይንቲስቶች ቢያንስ እ.ኤ.አ. ከ1952 ጀምሮ ሶስት የቤል ላብስ ተመራማሪዎች ነጠላ አሃዞችን መለየት የሚያስችል ስርዓት ሲፈጥሩ በኮምፒዩተር ንግግር ማወቂያ ላይ እየሰሩ መሆናቸውን የአይ ዳይናሚክስ ዋና የቴክኖሎጂ ኦፊሰር ራያን ሞንሱሬት ለኢሜል በላኩት መልእክት ተናግሯል። የሕይወት መስመር። እ.ኤ.አ. በ1990ዎቹ፣ የንግግር ማወቂያ ስርዓቶች ለገበያ ይገኙ ነበር ነገርግን አሁንም ቢሆን እንደ ጤና አጠባበቅ ካሉ በጣም ልዩ ከሆኑ የመተግበሪያ ጎራዎች ውጭ ጥቅም ላይ ለማዋል የሚያስችል ከፍተኛ የሆነ የስህተት መጠን ነበራቸው።
"አሁን ጥልቅ የመማሪያ ሞዴሎች ስብስብ ሞዴሎችን (እንደ ማይክሮሶፍት ያሉ) በንግግር ማወቂያ ላይ ከሰው በላይ አፈፃፀም እንዲኖራቸው አስችሏቸዋል፣ ከኮምፒዩተሮች ጋር በተመጣጣኝ መጠን ተናጋሪ-ተኮር የቃል ግንኙነትን ለማስቻል የሚያስችል ቴክኖሎጂ አለን ሲል ሞንሱሬት ተናግሯል። "ቀጣዩ ደረጃ Siri ወይም Google's AI ረዳቶች የሚጠቀም ማንኛውም ሰው ወደዚህ የንግግር ማወቂያ ደረጃ እንዲደርስ ወጪውን ዝቅ ማድረግን ይጨምራል።"
AI ለንግግር ማወቂያ ጠቃሚ ነው ምክንያቱም በጊዜ ሂደት በመማር ሊሻሻል ይችላል ሲሉ የ AI ቮይስ ኩባንያ Verbit.ai ዋና የገቢ ኦፊሰር እና ዋና ስራ አስኪያጅ ኤሪኤል ዩትኒክ ለLifewire በኢሜል ቃለ መጠይቅ ተናግሯል። ለምሳሌ፣ ቨርቢት በቤቱ ውስጥ ያለው AI ቴክኖሎጂ የበስተጀርባ ድምጽን ፈልጎ በማጣራት እና ዝርዝር፣ ሙያዊ ግልባጮችን እና የቀጥታ እና የተቀዳ ቪድዮ እና ኦዲዮ መግለጫ ፅሁፎችን ለማፍለቅ ምንም አይነት ንግግሮች ሳይወሰን ድምጽን ያስተጋባል እና ይገለብጣል ይላል።
ነገር ግን ዩትኒክ አብዛኞቹ አሁን ያሉ የንግግር ማወቂያ መድረኮች ከ75-80% ትክክል ናቸው ብሏል።
"ከፍተኛ ጥራት ያለው እና ከፍተኛ ትክክለኝነት የመጨረሻውን ግልባጭ ለማረጋገጥ በግንባታ፣ በአራሚዎች እና በአርታዒዎች የሚደረገው የግል ግምገማ አስፈላጊ በመሆኑ AI ሰዎችን ሙሉ በሙሉ አይተካውም" ሲል አክሏል።
የተሻለ የድምፅ ማወቂያ ሰርጎ ገቦችን ለመከላከል ጥቅም ላይ ሊውል ይችላል ሲሉ በድምጽ ማወቂያ ኩባንያ ሚቴክ ሲስተምስ ምክትል ፕሬዝዳንት የሆኑት ሳንጃይ ጉፕታ በኢሜል ተናግረዋል ።ጥናቱ እንደሚያመለክተው በሁለት አመት ውስጥ 20 በመቶ የሚሆኑት የተሳካላቸው መለያን ለመቆጣጠር ከሚደረጉ ጥቃቶች መካከል ሰው ሰራሽ የሆነ የድምጽ መጨመር እንደሚጠቀሙ ተናግረዋል፡
"ይህ ማለት ጥልቅ የውሸት ቴክኖሎጂ ይበልጥ እየተራቀቀ ሲመጣ እነዚህን ዘዴዎች ከምስል እና ቪዲዮ ጥልቅ ሀሰተኛ ዉሸት ጎን ለጎን መዋጋት የሚያስችል የላቀ ደህንነት በአንድ ጊዜ መፍጠር አለብን ሲል ጉፕታ ተናግሯል። "የድምጽ ማፈንዳትን ለመዋጋት የቀጥታ ድምጽ እና የተቀዳ፣ ሰው ሰራሽ ወይም በኮምፒውተር የመነጨ የድምጽ ስሪት መካከል ያለውን የመለየት ችሎታ ያለው የቀጥታነት ማወቂያ ቴክኖሎጂ ያስፈልገዋል።"
እርማት 2022-05-04: የራያን ሞንሱሬት ስም አጻጻፍ በአንቀጽ 9 ላይ ተስተካክሏል።