Siri、Google語音助理不只能對話，連你說「反話」都知道！

機器是怎麼聽懂人說話的？

要讓機器聽懂人說的話，首先我們需要讓機器可以把聽到的一段聲音訊號變成文字，也就是所謂的語音辨識（speech recognition）。有了這些由聲音訊號辨識出來的文字不代表機器就已經理解了，對於機器來說這些文字就像是一個沒有學過的語言，還需要透過學習才能夠理解文字的內容。

跟著鄉民去湊熱鬧

傳統的文本內容有文法及結構，在學習上比較有跡可循；而網路用語往往讓人丈二金剛摸不著頭腦，不僅內容隨著時間千變萬化又包含著各種縮寫，詞彙的意義也和該網路社群的文化有關。因此，機器是否能夠理解網路用語並當一個合格的「鄉民（註1）」，可以作為衡量機器學習能力的指標。

批踢踢實業坊（簡稱批踢踢、PTT）的八卦版是國內知名的網路論壇之一，在經過八卦版3個月份量的文章洗禮之後，機器儼然已經脫離了「新警察（註2）」的角色。比如常見的用語「好棒棒」和「好棒」看似差不多，但其實在批踢踢用語裡是恰恰相反的兩個詞彙。經過訓練之後，當機器被問到「好棒棒」的相似詞為何時，已經能給出「阿不就好棒棒」、「好清高」及「好高尚」等等的答案，從這個結果我們就可以知道，機器是真的理解這個詞彙的用法，能夠發現「好棒棒」在其表面的詞意以外，其實具有反諷的意涵。

讓機器懂你的心

擁有理解不同詞彙意義的能力之後，接下來我們很自然地會希望機器能理解整個句子的內容。怎麼樣去衡量機器是否能夠達到這個任務呢？第一步，要交付給機器的任務就是情緒分析(sentiment analysis)，機器必須要能夠分析語句的情緒，判斷內容的情緒是「正面的」還是「負面的」。這件事情可以透過遞迴神經網路模型的訓練來達成，比如說：

·「AI is powerful, but it’s hard to learn.」

·「AI is hard to learn, but it’s powerful.」

·「AI is powerful, even though it’s hard to learn.」

這幾個句子的結構幾乎相同，只有調動詞語的順序，或者字詞上的輕微差別；但是經過訓練的機器可以判斷出這些句子的情緒分別是「負面的」、「正面的」、「正面的」。這個功能雖然只有簡單的在「正面」、「負面」兩種選擇之間進行判斷，卻可以發展出生活化且相當實用的應用，比如說：現在網路上的評價制度在使用者的評價以外還須附上分數；如果是遊記、食記等心得體驗文則以文章形式呈現。這類觸及廣大讀者卻不受統一評分制度限制的內容，也應當是業者需要蒐集來作為改進參考的意見。

ELITES INSIDER

Siri、Google語音助理不只能對話，連你說「反話」都知道！

機器是怎麼聽懂人說話的？

跟著鄉民去湊熱鬧

讓機器懂你的心

Follow Us On Facebook

Subscribe Us On Youtube

Sponsored by

Recent Posts