AI- సృష్టించిన కంప్యూటర్ ప్రసంగం మరియు నిజమైన, ప్రత్యక్ష మానవుడి మధ్య వ్యత్యాసాన్ని మీరు చెప్పగలరా? బహుశా మీరు ఎప్పుడైనా అనుకోవచ్చు. బహుశా మీరు అలెక్సా మరియు సిరిని ఇష్టపడతారు కాని మీరు వారిలో ఎవరినీ అసలు స్త్రీతో కలవరపెట్టరని నమ్ముతారు.
విషయాలు చాలా ఆసక్తికరంగా ఉన్నాయి. గూగుల్ ఇంజనీర్లు టెక్స్ట్-టు-స్పీచ్ సిస్టమ్ను రూపొందించడంలో చాలా కష్టపడ్డారు టాకోట్రాన్ 2 . ఒక ప్రకారం కాగితం వారు ఈ నెలలో ప్రచురించారు, సిస్టమ్ మొదట టెక్స్ట్ యొక్క స్పెక్ట్రోగ్రామ్ను సృష్టిస్తుంది, ప్రసంగం ఎలా వినిపించాలో దృశ్యమాన ప్రాతినిధ్యం. ఆ చిత్రం గూగుల్ యొక్క ప్రస్తుత వేవ్ నెట్ అల్గోరిథం ద్వారా ఉంచబడింది, ఇది చాలా సహజమైన ధ్వనించే మానవ ప్రసంగాన్ని ఉత్పత్తి చేయడానికి చిత్రాన్ని ఉపయోగిస్తుంది.
స్నానపు సూట్ జోసినా ఆండర్సన్ వయస్సు
ఈ పద్ధతిని ఉపయోగించి, పరిశోధకులు నివేదిస్తున్నారు, 'మా మోడల్ వృత్తిపరంగా రికార్డ్ చేసిన ప్రసంగం కోసం 4.58 యొక్క MOS తో పోల్చదగిన 4.53 సగటు అభిప్రాయ స్కోరు (MOS) ను సాధిస్తుంది.' (సగటు అభిప్రాయ స్కోరు అనేది ఒక టెలికమ్యూనికేషన్ పదం, ఇది జీవితానికి నిజం ఎలా ఉంటుందో కొలుస్తుంది.)
గూగుల్ యొక్క ఆడియో నమూనాలు ప్రదర్శించినట్లుగా, టాకోట్రాన్ 2 సందర్భం నుండి 'ఎడారి' అనే నామవాచకం మరియు 'ఎడారి' అనే క్రియ, అలాగే 'వర్తమానం' మరియు 'వర్తమానం' అనే నామవాచకం మధ్య వ్యత్యాసాన్ని గుర్తించగలదు మరియు తదనుగుణంగా దాని ఉచ్చారణను మార్చగలదు. ఇది క్యాపిటలైజ్డ్ పదాలకు ప్రాధాన్యత ఇవ్వగలదు మరియు ఒక ప్రకటన చేయకుండా ప్రశ్న అడిగేటప్పుడు సరైన ఇన్ఫ్లేషన్ను వర్తింపజేస్తుంది.
మరియు ఇది మానవ ప్రసంగానికి సమానమైన వచనాన్ని సృష్టించగలదు, వ్యత్యాసాన్ని తెలుసుకోవడం కష్టం లేదా అసాధ్యం. మీరు ఎంత కష్టపడుతున్నారో చూడాలనుకుంటే, Google కి వెళ్లండి ఆడియో నమూనాల పేజీ , మరియు 'టాకోట్రాన్ 2 లేదా హ్యూమన్?' పేరుతో చివరి నమూనాల సమూహానికి క్రిందికి స్క్రోల్ చేయండి. అక్కడ మీరు టాకోట్రాన్ 2 మరియు ఒక నిజమైన వ్యక్తిని చూస్తారు, 'ఆ అమ్మాయి స్టార్ వార్స్ లిప్స్టిక్ గురించి వీడియో చేసింది.'
స్పాయిలర్ హెచ్చరిక: మిమ్మల్ని మీరు పరీక్షించుకోవడానికి, నమూనాలను వినండి మరియు ఈ కాలమ్ యొక్క మిగిలిన భాగాన్ని చదవడానికి ముందు ఇది ess హించండి.
కాబట్టి ఏ నమూనాలు టెక్స్ట్-టు-స్పీచ్ మరియు నిజమైన మానవ స్వరం? గూగుల్ యొక్క ఇంజనీర్లు చెప్పడం లేదు, కానీ వారు చాలా పెద్ద క్లూని మిగిల్చారు. ప్రతి .wav ఫైల్ నమూనాలలో 'gen' లేదా 'gt' అనే పదాన్ని కలిగి ఉన్న ఫైల్ పేరు ఉంది. కాగితం ఆధారంగా, టాకోట్రాన్ 2 ఉత్పత్తి చేసిన ప్రసంగాన్ని 'జెన్' సూచిస్తుంది మరియు 'జిటి' నిజమైన మానవ ప్రసంగం. ('జిటి' అంటే 'గ్రౌండ్ ట్రూత్', అంటే యంత్ర అభ్యాస పదం అంటే 'నిజమైన ఒప్పందం' అని అర్ధం.)
ఇది సరైనదని uming హిస్తే, పరీక్షకు సమాధానాలు ఇక్కడ ఉన్నాయి:
జోన్ జెట్ ఎవరిని వివాహం చేసుకున్నాడు
'ఆ అమ్మాయి స్టార్ వార్స్ లిప్స్టిక్ గురించి వీడియో చేసింది.'
నమూనా 1: నిజమైన మానవ
నమూనా 2: టాకోట్రాన్ 2
'ఆమె కొలంబియా విశ్వవిద్యాలయం నుండి సామాజిక శాస్త్రంలో డాక్టరేట్ సంపాదించింది.'
నమూనా 1: టాకోట్రాన్ 2
నమూనా 2: నిజమైన మానవ
'జార్జ్ వాషింగ్టన్ యునైటెడ్ స్టేట్స్ యొక్క మొదటి అధ్యక్షుడు.'
నమూనా 1: టాకోట్రాన్ 2
నమూనా 2: నిజమైన మానవ
జానీస్ డికిన్సన్ నికర విలువ 2015
'నేను రొమాన్స్ కోసం చాలా బిజీగా ఉన్నాను.'
నమూనా 1: నిజమైన మానవ
నమూనా 2: టాకోట్రాన్ 2
మీకు ఎన్ని సరైనవి? మరియు మీరు నిజంగా వ్యత్యాసాన్ని చెప్పగలరా, లేదా మీరు to హించవలసి ఉందా?