在央視紀(jì)錄頻道播出的大型紀(jì)錄片《創(chuàng)新中國》,可以說是今年非常熱門的紀(jì)錄片了。《創(chuàng)新中國》最大的亮點是,解說部分全程利用人工智能配音,同時也讓這部片子成為世界首部利用人工智能模擬人聲完成配音的紀(jì)錄片。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
《創(chuàng)新中國》合成模仿的是“配音大師”李易的聲音,很多網(wǎng)友紛紛表示聽不出來是機器在配音?!本瓦B央視主持人朱軍、李瑞英也不得不為這樣的技術(shù)折服。李易老師在2013年就已去逝,而人工智能卻實現(xiàn)了原聲“重現(xiàn)”,究竟是采用什么樣的技術(shù)才達到 “以假亂真”的效果呢?
1.? 如何實現(xiàn)AI為紀(jì)錄片配音?
? ? ? ?其實人工智能合成語言早已出現(xiàn),語音識別技術(shù)作為人工智能的一部分,中國已達到世界領(lǐng)先水平,目前也已應(yīng)用在多個領(lǐng)域。比如高德地圖志玲姐姐的語音導(dǎo)航、聽Angela baby版本的天氣播報、有聲閱讀讓看書不再枯燥...這些AI配音正在為我們的生活帶來便利。但作為全球第一部全篇采用人工智能配音的紀(jì)錄片,很多人還是對《創(chuàng)新中國》產(chǎn)生了疑問。
? ? ?2.AI能否取代人工配音
? ? ? ?AI配音在《創(chuàng)新中國》中的試驗看起來非常成功,如果在行業(yè)內(nèi)廣泛應(yīng)用,配音這個職業(yè)真的會被AI取代嗎?同樣的道理,譯制片、動畫片、電影、電視劇是不是也可以利用AI進行配音呢?配音這個行業(yè)是不是不需要真人了呢?答案并沒有這么簡單。
? ? ? ?以《創(chuàng)新中國》為例,片中配音整體效果很好,從表面上幾乎聽不出太多差別,但仔細(xì)聽不難發(fā)現(xiàn)依然存在很多問題。比如片中第一集的配音:“與市面上其他無人機相比,物流無人機的不同在于,它既要適應(yīng)高頻次的飛行,還要保證把貨物安全送往目的地…”,這段AI配音字與字之間的黏連太過機械,重音也不清晰,這樣的情況出現(xiàn)了很多處。又如配音:“2017年9月15日深夜,72歲的天文學(xué)家,中國“天眼之父”南仁東去逝。”這段應(yīng)該表達對科學(xué)家的懷念之情,但是AI的配音冰冷刻板,沒有感情色彩。
除此之外,對于激動等情緒的表達,也明顯能夠感受到AI和真人配音之間的差距。為了達到最大的效果,技術(shù)團隊從細(xì)節(jié)做起,不斷反復(fù)對比幾個版本內(nèi)容的差別,在字與字之間的流暢性、個別詞語的重音、語句的節(jié)奏變化和合成后的噪音等問題上入手,利用專業(yè)的算法程序進行針對性的優(yōu)化,進一步改善了發(fā)音、音質(zhì)、重音、停連等方面的效果。即使是這樣,配音中需要流露感情的地方,機器人也沒有辦法實現(xiàn)。
? ? ? ?除了紀(jì)錄片,其他類型的影視作品配音更需要感情豐富的配音員進行藝術(shù)演繹,AI配音目前還達不到要求。