為什麼這篇chatgpt論文比對鄉民發文收入到精華區:因為在chatgpt論文比對這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者joanzkow (星浪)看板AfterPhD標題[新聞] 論文抄襲案都靠它!「快刀」背後的11...
論文抄襲案都靠它!「快刀」背後的11人小公司,如何搶攻 AI 市場大餅?
2023/04/25
by 《遠見》 陳品融
「生成式 AI 來了以後,生意真的很好。」最近,雲書苑教育科技總經理林政宏勤跑市區
開會,位於北投的辦公室因準備擴編而整修中,外人不便進入。採訪當天也不例外,他剛
結束行程,便匆匆在附近與我們會合。
這家規模僅 11 人的小公司,成立十餘年來,在學術界扮演舉足輕重的地位。2010 年,
雲書苑推出中文相似度比對系統「快刀」,協助找到前國防部長楊念祖、高雄市議員李眉
蓁、前新竹市長林智堅等人的論文抄襲案,至今在全國大專院校擁有 7 成市占率,更曾
獲國家玉山品牌獎殊榮。
去年底,Open AI 推出聊天機器人 ChatGPT,為學術界的抄襲現象帶來新隱憂。挾著累積
多年龐大資料庫、及長年投入自然語言處理(NLP)開發的實力,雲書苑順勢於 3 月份推
出全球首創的「快刀AI先生」,丟入文章,系統就能判定由 AI 生成的比例,一推出便廣
受學術界探詢。
糾出《紅樓夢》文風差異,鎖定開發文章比對系統
雲書苑能有今天,最早還得從林政宏的童年開始說起。
1977 年蘋果推出風行全球的微電腦 Apple II,彼時就讀國小的林政宏,玩電腦就是生活
中最大樂趣。
「那時候只覺得電腦太難用、要跟它描述自己的需求還真困難。」林政宏回憶當時,一種
想有效達成「人機溝通」的憧憬萌生,爾後一路考上台大資工系,開始鑽研少有人投入的
自然語言處理(NLP),懷有創業家精神的他,畢業後陸續成立過軟體公司、也曾於海外
從事創投工作。直到 2010 年左右,他萌生開發文章比對系統的點子,找出至今仍存有作
者爭議的《紅樓夢》進行實驗。
「胡適用他的國學涵養,證明《紅樓夢》前 80 回和後 40 回是不同人寫的,但我們想展
現科學上的根據,」於是,團隊將全書進行斷詞,建立作者的用詞習慣表,最終落點分析
結果一目了然:前後作者的「文風」毫不重疊。
林政宏解釋,儘管書寫者的文風可能隨時間轉變,但必然會經過演進過程,不可能直接跳
換新風格,由此便能分辨書寫者的差異。
有了技術基礎,下一步就得思考應用場域。正巧團隊成員在寫論文過程中,難免碰上引用
問題,加上林政宏在閱讀他人論文時,也常感受到抄襲現象,促使他們抓準論文比對的商
機,進而推出「快刀」。
林政宏說明,一篇 5 萬字論文約得和 2 億篇文章進行比對才夠精準,團隊光是前期擴充
資料庫,就耗費大量心力。緊接著,為加速商業應用,他們建立起「特徵比對」機制,抽
取文中重要段落進行斷詞,與龐大資料庫進行文風分析,最終得出相似性比例,再交由審
查單位進行判定,如今一篇論文僅需十分鐘便能完成檢測。
事實上,快刀並非全球首創的產品,大專院校過去也常導入國外比對系統 Turnitin,但
林政宏指出,中文詞性經常轉變,其複雜度堪稱所有語言之最,國外公司要跨入、並掌握
足夠多的中文文獻並不容易,也讓他們站穩利基點。
與 Open AI 系出同門,可辨識 ChatGPT 書寫邏輯
十多年前,社會對論文抄襲的關注度尚不高,直到 2013 年,前國防部長楊念祖遭控涉嫌
抄襲,上任僅六天便下台,引發輿論譁然。過去雲書苑還得努力說服學校採購快刀,一夕
間,各校紛紛親自上門尋求協助。
「這幾年大家開始發現,原來一個人的誠信可以從論文反映,」林政宏說,不只學術界,
如今企業人資部門也會導入快刀查證高階主管論文,金管會甚至將之用在審查上市櫃公司
的永續報告書,可見應用範圍之廣。
長年累積的龐大資料庫,讓雲書苑在 ChatGPT 推出後,能快速推出「快刀AI先生」作出
應對。簡單來說,機器學習的方式,是將語言結構切割後,經由訓練形成一套字詞排列的
規律,本身並無意識。因此,對早就投入自然語言處理的雲書苑而言,他們輕鬆就能辨識
ChatGPT 的書寫邏輯。
「我們的演算法跟 Open AI 系出同門,真是撿到一個天大的禮物!」林政宏笑得開懷。
最近,許多學校老師正為 ChatGPT 頭痛不已,紛紛找上他們。其使用方法和快刀類似,
僅須將文字丟入系統,便會生成疑似由 AI 生成的比例。
見證 AI 從零到有,「跳上火箭就對了!」
不過挑戰就在於,如今學生已會將 AI 生成的文字一改再改,並丟回 ChatGPT 重新生成
,形成人機協作的「混合體」,根本難單憑相似度比例做出判斷,那快刀AI先生存在的意
義又為何?
林政宏強調,快刀AI先生是輔助而非裁判角色,有時可協助老師事先了解學生學習程度,
進而調整教學模式。
事實上,除了「快刀」和「快刀AI先生」兩套教育工具外,下一步,林政宏腦中又有了新
的計畫。
林政宏從包包中抽出一本繪本,乍看普通,一問之下,才發現是他就讀小二的兒子發想文
字內容後,請他利用 AI 生成圖像而成的作品。
眼見兒子對 AI 創作極有興趣,林政宏遂投入開發新產品,預計兩個月後將推出 AI 繪本
系統,主攻低齡教育市場,「小朋友說故事給小朋友聽,這在人類史上還真的是頭一回吧
!」他笑道。
從一個單純愛玩電腦、試圖和機器溝通的小男孩,到如今利用 AI 影響了教育界,見證從
零到有,林政宏形容,就像搭上火箭一般充滿快感,「總覺得未來充滿希望,火箭正在升
空了,跳上火箭就對了!」
https://fc.bnext.com.tw/articles/view/2841?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.150.243 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AfterPhD/M.1682519876.A.64A.html
※ 編輯: joanzkow (140.112.150.243 臺灣), 04/26/2023 22:39:15