究竟為什麼可以用講的就能夠自動製作成逐字稿呢?今天就來跟大家介紹一下語音辨識啦!

 

語音辨識(speech recognition)技術,又稱自動語音辨識(英語:Automatic Speech Recognition, ASR)、電腦語音識別(英語:Computer Speech Recognition)或語音轉文字識別(英語:Speech To Text, STT),目標是以電腦自動將人類的語音內容轉換為相應的文字,是一種可以讓程式透過書面形式處理人類語音的功能。

那麼,語音辨識跟聲音辨識是一樣的嗎?其實是完全不同的喔!

語音辨識著重於從口語轉換為文字,而聲音辨識則是試圖識別不同使用者的聲音!

 

我們越來越有錄音聽打做紀錄的需求,無論是訴訟、學術研究討論、演講、會議記錄,或者更日常一些,現在流行的Podcast也開始製作逐字稿,方便聽眾重複瀏覽內容。

 

那我們究竟是什麼時候開始有語音辨識需求的呢?是為了做逐字稿嗎?錄音聽打員的需求又是什麼時候開始的呢?

 

我們從語音辨識的歷史開始說吧!

 

其實早在發明電腦之前,自動語音辨識就已經開始有雛型了喔!最早的聲碼器開啟了語音辨識的歷史。最早的語音辨識產品則是1920年代生產的“Radio Rex”玩具狗。只要呼喚這隻玩具狗的名字,它就會從底座彈出來喔!最早的電腦語音辨識系統則是AT&T1貝爾實驗室開發的Audrey語音辨識系統,透過跟蹤語音中的共振峰辨識,能夠辨識10個英文數位,並且該系統得到了98%的正確率。到1950年代,倫敦學院將該語法概率加入語音辨識。1960年代,人工神經網路被加入了語音辨識,這一個時代做出了線性預測編碼Linear Predictive Coding及動態時間規整Dynamic Time Warp兩項突破性的技術。

 

語音辨識技術的最大突破——隱含馬爾科夫模型Hidden Markov Model應用

從相關數學推理到研究,最終卡內基梅隆大學的李開復等人實現了第一個基於隱馬爾科夫模型的大詞彙量語音辨識系統Sphinx。此後說語音辨識技術就再沒有脫離HMM框架。

 

到此AI語音辨識技術算是逐漸成熟,而多年來研究人員也一直嘗試推廣「聽寫機」。然而語音辨識仍然無法取代傳統的人工錄音聽打,無法完整辨識各種領域的術語,因此無法製作出完整不需要人工修改的逐字稿。˙

 

而關於錄音聽打製作逐字稿的部分,從什麼時候開始可以說是根本不可考了⋯

早期的逐字稿廣泛的被應用於會議記錄、訴訟、研討會等正式場合。一開始當然沒有錄音聽打,只有現場速記人員、會議記錄人員做直接的紀錄。

 

所以逐字稿跟會議記錄不一樣嗎?

是的,逐字稿跟會議記錄其實是不太一樣的!逐字稿的重點是原文的保留,除了一些多餘的贅字,例如嗯、對啊、然後、是啊是啊,這樣的贅字外,逐字稿是不會額外刪除記錄下來的文字的。而會議記錄跟逐字稿不同的地方在於,其重點為「議題」,並不是發言的內容。在做會議記錄的時候,不同於逐字稿,我們需要找到真正探討的議題,然後根據這個問題寫下筆記,才能做出有重點的會議記錄。

 

說來說去,我們還是來討論怎麼做逐字稿吧!

既然AI語音辨識其實無法完全替代人工逐字稿,那我們就來了解一下所謂的逐字稿,是怎麼樣製作出來的。

 

逐字稿要怎麼做呢?現在大部分的做法都是先使用錄音筆等錄音裝置,把需要做逐字稿的內容先錄下來。然後要做的當然就是就是錄音聽打啦!一字不漏的聽到什麼打什麼。在這個部分最辛苦的莫過於相當耗費精神以及耐心,對於錄音不清楚的部分,可能需要重複聆聽很多次。對於比較沒有錄音聽打經驗的人來說,可能工作十分鐘,才能製作一分鐘的錄音內容逐字稿呢!

 

那麼在聽打的時候有什麼需要注意的事情呢?

一、

標點符號很重要喔!在任何的文章裡,標點符號的使用都有它的意義存在。在寫逐字稿的時候,像是問句,就務必要使用問號作為結尾喔!

二、

遇到台語或是客語,必須要用國語打成文字,然後標記。

外語的部分則是直接擅打,不需額外翻譯。

三、

務必避免錯字,字詞的前後使用也必須要一致喔!

錄音聽打員最基本的專業就是不能夠打錯字,許多逐字稿都是用在學術研究、公家單位委託等相當正式的場合。即使不能夠一次就正確率百分之百,也應該反覆檢查大大降低錯誤率才顯得專業。

而經常出現的字詞,像是人名或者專有名詞,也都應該保持從頭到尾使用一致。

四、

不確定的專有名詞、地名、人名,請善用Google。

在錄音聽打的過程裡,我們常常聽到的音,不一定能夠馬上打出正確的字。

這個時候我們除了重複聆聽外,也可以使用搜尋的方式,去找到正確的寫法。

 

看到這裡是不是覺得錄音聽打是一件很辛苦的事呢?

其實這些都只是冰山一角,在真正做錄音聽打時,光是錄音品質的影響,就足夠花費很多精神與時間了!在逐字稿的需求逐漸擴大的情況下,我們只要找到一間適合的翻譯社,就能夠幫自己節省掉很多時間和精力囉!