close

今天真是尷尬... 沒好好看清教授的 e-mail,meeting其實是約在明天,
不過也不算是白跑一趟...   經過我在再理一下實驗時的資料,
進入教授的script跑一跑,實驗裡對照組的結果蠻令人為之一振的
跟我作實驗前預測的結果蠻像的...  
我們約好星期五再 meeting 一次,之後的日子應該有得寫了!

中文的斷句 (segmentation) 一直在電腦語言學裡是一門大學問,
有時一個字已經是一個詞,有時三個字要斷在一起才算有意義。
因為是算單詞的閱讀速度,又要加上詞性(主詞,動詞,受詞)的考量
第一次跑完 scirpt,結果不理想的原因是沒考慮到有時句中的主詞含了兩個詞...

論文裡的第二個部份-- 語料庫調查 (Corpus) 一直遲遲無法進行...
教授花了一百美元向中研院買的語料庫光碟片上的貼紙沒貼平,
電腦跑起來有怪聲...
當時我們都怕電腦因此壞了... 教授用的是Mac...
所以他建議把光碟帶回他家用別的舊電腦試
希望他當時不會心想... Made in Taiwan.... 其實我到現在也還弄不懂,
為什麼這套語料庫的使用手冊沒有英文版... 大概是希望外國人都學繁體中文吧!


arrow
arrow
    全站熱搜

    odelle 發表在 痞客邦 留言(0) 人氣()