為什麼要回顧? 談「AI 開發」很容易直接跳到今天的大模型,但若沒有走過過去,今天的進展會顯得沒有重量。 就像站在一棟大樓的頂樓俯瞰城市,你可能只看到風景,卻忽...
Attention 的出現,就像有人告訴你:「不用每個字都照順序讀完,你可以直接跳去看重要的地方。」 舉個開發時的體驗: 在做「中翻英」時,RNN 需要左邊讀...
今天大家隨口就是「GPT」、「大模型」,但如果沒有 Word2Vec、ELMo、GPT-2 這些「中繼站」,我們不可能走到現在。 在我看來,這些模型不只是技術上...
在過去幾年,生成式 AI 的研究大多集中於模型本身的能力:更大的參數、更豐富的語料、更高的準確度。然而,真正要讓 AI 落地到產業環境時,挑戰往往不在「模型會不...