除了 Meeting 12被取消外,最近和教授見面的蠻積極的 ,論文應該會按時出爐!

進度
從在台灣做完閱讀實驗回來以後,論文的第二個主要部分是在中研院的語料庫理找相同的句型。基本上是為了驗證之前實驗結果。比方說實驗結果是句型A比句型B需要的閱讀時間來的長,有理論提說:句型A較難的原因是因為這樣的句型在語料庫少見。意思就是說,雖然不是溫故知新,但常看到的話總是比較容易理解。

什麼是語料庫調查?
語料庫其實就是有一堆被系統地整裡出來的各式代表性文章,從小說到劇本,報章雜誌,有些還有對話。在這電腦科器講究的時代裡,我當然不是一篇文一篇文的去找我要的句型。語料庫通常附有詞性標記,我的工作只是寫幾個小程式,然後電腦會幫我找。

為什麼要作語料庫調查?
早年念語言學的人多是憑著母語的直覺撰文挑論各式語言理論,例句可能多是憑空捏造的。現在則是要拿出數據來,人家才會相信。不僅是真人測試的實驗結果重要,以測句型的文法性、可行性,還要查查句性的『市場佔有率』,就是看看是否真的有人使用這樣的句型。

結果有什麼好處?
提高機器作閱讀的準確度。找出句型裡造成閱讀困難的原因,增加機器或軟體對閱讀的預測性~~其實我的畢業論文只是其中的小小一環啦...不過基本上這就是念電腦語言學的人在念的一些方向之一! 

 這次我寫下來了~~回台灣不要在問我到底在念什麼了....



arrow
arrow
    全站熱搜

    odelle 發表在 痞客邦 留言(0) 人氣()