[爆卦]全文檢索軟體是什麼?優點缺點精華區懶人包

雖然這篇全文檢索軟體鄉民發文沒有被收入到精華區:在全文檢索軟體這個話題中,我們另外找到其它相關的精選爆讚文章

在 全文檢索軟體產品中有5篇Facebook貼文,粉絲數超過30萬的網紅報時光UDNtime,也在其Facebook貼文中提到, 【2001年2月19日聯合知識庫誕生】 19年前聯合報系成立線上新聞資料庫 ─「聯合知識庫」 昔日新聞標題「一網看盡五十年」 今日需要更新為六十九年了 經營者在多年前的精準判斷 團隊下足資源傾力建置 聯合知識庫已是華文報刊資料庫最完整的平台 除了是研究資源 在可讀性及實用性上 報時光持續挖掘紀錄 和...

  • 全文檢索軟體 在 報時光UDNtime Facebook 的精選貼文

    2020-02-19 10:27:23
    有 189 人按讚

    【2001年2月19日聯合知識庫誕生】
    19年前聯合報系成立線上新聞資料庫
    ─「聯合知識庫」
    昔日新聞標題「一網看盡五十年」
    今日需要更新為六十九年了
    經營者在多年前的精準判斷
    團隊下足資源傾力建置
    聯合知識庫已是華文報刊資料庫最完整的平台
    除了是研究資源
    在可讀性及實用性上
    報時光持續挖掘紀錄
    和大家分享歷史
    一起來回顧

    日期:2001/2/19
    圖說:聯合報系聯合線上聯合知識庫udndata.com舉辦開站上線記者會。圖為聯合報發行人王效蘭(左起)、聯合報系董事長王必成、聯合線上執行長王文杉與聯合線上營運長劉永平。
    報別:聯合報
    攝影:林鍚銘

    #聯合知識庫把過去半世紀的台灣發展過程放進網路資料庫
    #成為全世界想要了解華人世界的一個重要平台
    #光學辨識技術OCR進行報紙的整版掃描 #再用圖文切割方式將報紙版面上的內容分區切塊辨識儲存
    #以新開發的系統進行兩循環校對除錯
    #報時光UDNtime

    歷史新聞

    【2001-02-19/聯合報/11版/話題】

    王文杉:讓龐大資訊轉化為知識
    強調社會價值遠勝一切 盼未來與其他媒體及出版界合作 創造更大的知識平台

    【記者李彥甫╱專訪】聯合報系線上資料庫─「聯合知識庫」今天正式啟用,將成為華人世界最完整的新聞資料庫。聯合報系總管理處副總經理、聯合線上公司(udn,com)執行長王文杉指出,聯合報系致力發展五十年的線上資料庫,主要目的是希望回饋社會,不僅為台灣過去半世紀的發展留下紀錄,更希望透過知識管理系統,讓新聞資訊能夠系統地轉化為知識,協助社會與民眾一起進步。聯合知識庫也希望與各媒體及出版界合作,創造更大的知識平台。以下是記者專訪紀要:

    問:聯合報系五十年來累積了非常豐富的新聞資產,報系如何看待新聞資產與知識累進之間的關係?

    答:聯合報系過去五十年一直專心新聞事業,一方面滿足讀者知的權利,另一方面也留下了非常豐富的珍貴史料,但這些珍貴資料過去只有極少數人可以接觸,充其量只能稱為資訊,不但不能為社會大眾所用,也不能進一步成為創造知識的基礎。知識的範圍很廣,但最基本的,它必須是一種可以做為判斷基礎的資訊。如今聯合知識庫上線,才有可能實現許多理想,經由資訊轉化為知識,希望可以幫助許多讀者進行判斷,也幫助許多機關或公司進行決策。

    問:什麼動機促使聯合報系選在此時發展線上資料庫?

    答:聯合報系一直認為,資訊「電子化」與「普及化」是很重要的事,早在十年前就已推動報系資訊中心的電腦化,當時也曾想過類似資料庫電子化的計畫,但那時的技術非常不成熟,不僅要耗費巨資,產品也會讓使用者覺得不便。一直到最近相關技術成熟,聯合報系也開始發展網際網路事業,可說是一切水到渠成。

    問:聯合知識庫發展時程與規模?

    答:根據估算,聯合報系過去五十年來一共出版了約一百三十萬個報紙版面、一千多萬則新聞、七十餘億個字。目前聯合知識庫正逐日逐月地、由近至遠回溯過去的報紙,每天新增資料量約六千五百筆,其中包括當天聯合報系國內五份報紙的約一千五百則新聞,回溯資料約有五千則。截至目前為止,聯合知識庫內已收錄最近兩年、共七十萬餘筆新聞資料,已是國內最大的線上新聞資料庫。

    聯合知識庫預計在四年內,完成五十年來聯合報系所有報紙資料數位化計畫(暫時不含聯合報地方版 )。今年適逢聯合報成立五十週年,將集中力量優先進行解嚴後的聯合報全國版新聞資料的數位化工程,預計在今年九月前完成。

    問:有人認為,五十年的新聞資料庫的歷史價值大於商業價值,您同意這種說法嗎?可以從商業市場上回收投資嗎?

    答:談到新聞資料庫的「價值」,我們必須對價值做一定義,價值其實有些主觀,像是一種價值觀。對於新聞資料庫,我確實認為「歷史價值」大於「商業價值」,「無形商業價值」也大於「有形商業價值」,但這並不等於新聞資料庫「沒有價值」。我們相信聯合知識庫帶來的社會價值遠勝於一切,更勝於進帳多少筆收入。

    聯合知識庫把過去半世紀的台灣發展過程放進網路資料庫,這是華人世界的第一套,首要建立大眾化的使用環境,因此也不能讓一般人無法負擔。我們希望提供的不只是「資料庫」,而是「知識庫」,不是傳統電子商務的賣資料而已。從傳統商業角度來看,這項投資短期內較難回收,因為現在投入很高的成本建立自動化機制,但未來定期的維護成本將會非常低,因此細水長流是很有機會的。

    另一方面,對於傳統電子商務模式也需要重新思考,台灣的人口不過兩千一百萬人,直接面對消費者的電子商務(B2C)不容易生存,因此需要把眼光放大至全球華人市場。站在聯合報系「為全球華人辦報」的一貫立場,聯合知識庫將成為全世界想要了解華人世界的一個重要平台,未來我們會與美國各大學的中國研究中心合作。我相信遲早這項投資可以回收,而且將是非常有價值。

    問:聯合知識庫除了全文檢索功能,還設計了不少新功能,例如「人工智慧查詢」,目的何在?

    答:這有不同層次的意義,最簡單的目的是希望讓使用者可以很容易地使用,找到他真正想找的資訊;更進一步地,聯合知識庫希望透過人工智慧的知識管理平台,讓龐大的資訊可轉化為具有價值的知識。

    問:知識庫目前已創造了一個線上資料庫的新平台,未來考慮與其他媒體合作,收錄非聯合報系的新聞或知識資產嗎?

    答:未來我們肯定希望與其他媒體合作,事實上不只媒體,更希望與華文出版界合作。因為出版界的內容有其一定的深度,這是報紙媒體本身很難完全取代的,例如對於核四的討論,聯合報系的報紙上有新聞、也有深入分析與新聞辭典,聯合知識庫也對核四議題做了一些專卷,這已足夠滿足多數民眾。但如果有讀者想要深入了解各種能源的電力成本細節、各種能源的發電效率,就需要有出版界的資料加入。出版界如果自己發展一個平台,反而沒有商業價值,彼此結合才能茁壯。另一方面,當頻寬等技術更成熟後,聯合知識庫也希望結合影音、圖片資料,讓內容更豐富。

    【2001-02-19/經濟日報/5版/綜合新聞】

    運用人工智慧 檢索如虎添翼

    【記者李彥甫╱台北報導】由於至今仍沒有一項技術可以滿足舊報紙數位化的技術需求,今(19)日正式上線的聯合知識庫(http://udndata.com),事實上是整合國內外多項技術,克服各項技術障礙,自行開闢了一條新途徑,才能造就最大的華文新聞資料庫。

    過去50年來,報紙的排版、印刷技術都經歷了多次技術革命,報紙數位化的工程面臨不少困境需要克服。

    因為報紙跨越的年代非常久遠,20年前的報紙仍是以鉛字排版,紙張品質也不若現在,如何以高度自動化技術處理幾十年前的舊報紙,難度很高。另一方面,如何提高原本報紙內容數位化之後的正確率,也是校對技術上的高難度工作。

    簡單的說,聯合知識庫在全景軟體公司協助下,以光學辨識技術(OCR)進行報紙的整版掃描,再用圖文切割方式,將報紙版面上的內容分區切塊辨識儲存,然後再以新開發的系統進行兩循環校對除錯。

    聯合知識庫目前採用的解決方案,單機每日可以產出136萬字,經過兩次循環校對後,正確率可高達99.91%,在成本效益與執行績效上,可說是相當成功。在目前中文辨識的相關技術中,也已是辨識成功率最高的辦法。

    「聯合知識庫」. 為了讓使用者可以有最簡單的方式找到想要的資訊,特地引進美國亞歷桑納大學人工智慧實驗室與「知識運算公司」 (KCC)的知識管理系統,開發中文相關詞的人工智慧分類,除了提高使用效率,也可以激發使用者對於資訊的不同思考。

    美國亞歷桑納大學人工智慧實驗室主任陳炘鈞教授、知識運算公司總裁比爾‧羅威 ( Bill Lowe)此次也特地來台,參加今天的聯合知識庫啟用典禮。陳炘鈞指出,在美國,人工智慧的知識管理系統已被很多單位應用,例如,情報系統、警政系統、證券期貨、醫學界、大型公司等,資料庫的需求是「準確、快速、簡單」時,更需要使用人工智慧。

    不過,人工智慧的知識管理系統應用在中文新聞資料庫上,「聯合知識庫」卻是首開先例。

    由於聯合報系50年來累積的新聞資料量非常龐大,例如鍵入「陳水扁」三字,使用一般的搜尋引擎檢索過去兩年的資料庫,結果可能出現兩萬多筆資料,除非使用者可以自行縮小範圍繼續檢索,否則反而會造成更大的困擾。

    因此,想要協助使用者查詢到真正想看的新聞資料,需要加上一些輔助工具,例如人工智慧系統,簡單地說,聯合知識庫的「智慧查詢」是「一種會思考的全文檢索」。

    智慧查詢主要是一種「相關詞彙分析」,只要資料量夠大,由人工智慧系統動態、自動地找出資料庫中,與關鍵字一起出現頻率最高的兩百個相關詞,例如「陳水扁」的相關詞中包括「總統」、「市長」、「候選人」、「一個中國」等。陳炘鈞表示,資料量累積愈多,人工智慧的功效愈能顯現。

    【2001-02-20/聯合報/5版/話題】

    專家談「第三代人工智慧」 udndata甚至會給使用者不同建議

    陳炘鈞:新聞超過千萬筆,就知它的威力

    【記者李若松╱專訪】聯合知識庫(udmdata,com)網站昨天正式啟用,與傳統新聞資料庫最大的不同,除了呈現聯合報系五十年新聞的深度與廣度外,還提供智慧型全文檢索、專卷查詢、我的剪報、自動剪報系統等四大關鍵工具,其中美國亞歷桑那大學人工智慧實驗室主任陳炘鈞領導的「知識運算公司」開發的人工智慧資料加值技術,更使聯合知識庫如虎添翼。

    陳炘鈞是交通大學管理科學系畢業,先後在紐約州立大學攻讀資訊管理與資訊科學,得到博士學位,從一九八五年研究所階段就投入人工智慧應用在資料處理的研究領域中,也在亞歷桑那大學建立人工智慧實驗室及霍夫曼電子商務實驗室,並擔任資管系講座教授。

    陳炘鈞解釋,一般網站全文檢索功能很簡單,第一代人工智慧是模擬人的行為,一般全文檢索是用第二代人工智慧─專家系統,輸入專家制訂的規則,未列入的規則就找不出結果;聯合知識庫使用的第三代人工智慧則是目前全球資料庫的主流方向,讓資料庫自動產生有意義的知識。

    陳炘鈞表示,聯合知識庫的智慧型全文檢索系統,可以引導使用者多面向思考,將概略性資料去蕪存菁,並提供檢索的線索,留下使用者真正需要的資料。聯合知識庫產生的資料,不需要人工設定規則,純粹是由電腦分析後自動產生,依經驗法則給使用者建議,除了像輸入「陳水扁」、發現資料太多,可以建議較小範圍的線索外,還可能在搜尋

    「釣魚台事件」時,建議使用者查「台獨運動」。

    陳炘鈞分析,國外的英文資料庫如果要具有人工智慧,必須了解、分析英語語法;中文新聞資料庫全文檢索則必須運用統計方法找出「最長的關鍵詞」,他的實驗室同時具備兩種分析技術,未來會在聯合知識庫提供更多新的服務功能。

    陳炘鈞曾經替美國亞歷桑那州警政機關發展「警務系統」,正是一套人工智慧系統,能夠在警方百萬筆至一千多萬筆犯罪檔案資料中,快速找到嫌犯資料。

    陳炘鈞表示,聯合知識庫目前僅處理近百萬筆資料,還顯不出人工智慧的威力,等到新聞資料輸入超過一千萬筆時,就能彰顯出聯合知識庫從資料庫產生有價值知識的潛力。

  • 全文檢索軟體 在 新思惟國際 Facebook 的最佳解答

    2020-01-06 12:00:15
    有 54 人按讚

    #台北慈濟醫院_麻醉部_洪聖凱_醫師
    #寫論文一個不小心就會幫自己樹立敵人
     
    和之前使用過的統合分析軟體相比,我發現 CMA 真的比較容易上手,不用一直使用軟體的跳出視窗來輸入,不用撰寫程式語言。直接貼上 spreadsheet,就可以 run analysis。實際操作,就能理解為什麼蔡校長選擇 CMA,當作入門授課的軟體。
     
    🛡 寫論文,不是要樹立敵人。
     
    大多數的文章,會把統合分析列在 original article,因此秉濤醫師建議依照四大段(introduction、methods、results、discussion)的格式來進行撰寫。Introduction 要向審稿者強調為什麼要接受你的文章,這篇文章是不是可以回答過去有矛盾、有爭議的問題點,凸顯重要性。
     
    秉濤醫師也整理了許多論文寫作過程的重點,例如向原作者要資料的技巧、怎麼排除文章才不會樹立敵人、辛苦萃取資料後,要如何列表呈現,才能讓審閱者一目了然,每一個重點提示,都是要讓我們辛苦寫出來的作品,距離被刊登更近一步。
     
    另外,秉濤醫師提到的搜尋策略 N-1 法則,對我來說相當實用。之前嘗試目視過濾數十篇文章,覺得十分痛苦,如果能掌握這個法則,一定可以有效率的進入全文檢索的步驟,也不會一個不留神,就放掉相關的文章。
     
     
    🎯 初學者真的可以嗎?我需要有怎樣的基本能力?
     
    初學者真的可以,經過我們的拆解與教學,其實 meta-analysis 並不難。
     
    你只要會用 Windows,懂得使用像 Word / Excel / PowerPoint 這樣的軟體,就足夠了。上課我們會把重要的觀念講給你懂,而互動實作就是理解流程,只要懂得電腦操作,能照著教學步驟,點擊正確的功能,就沒問題。
     
    一些枝微末節的卡關,現場講師與助教,會全力協助您。請放心。
     
    課程團隊有信心,這將會是在最短時間內,協助最多校友起步的領域。歡迎與我們一起,從 0 到 1。
     
     
    🔺 面向新手、協助起步,從 meta-analysis 最快!
    🔺 2020 / 3 / 7(六)統合分析工作坊
    🔺 https://meta-analysis.innovarad.tw/event/

  • 全文檢索軟體 在 報時光UDNtime Facebook 的最佳貼文

    2019-09-27 10:51:18
    有 240 人按讚

    【Google美夢成真】
    你知道Google曾經是雅虎的搜尋引擎廠商嗎?
    20年前你我還在撥接連線
    當年Google成為雅虎搜尋引擎供應商
    而執行長培巨也曾為
    開拓華文市場來台與蕃薯藤結盟
    一起來回顧

    #還記得有什麼搜尋引擎?
    #時代浪潮一來連回憶都好稀薄
    #站在巨人的肩膀上google好榜樣
    #報時光UDNtime

    上圖:Google頁面 2001-03-06 民生報
    下圖:Google總裁Larry Page(左)與蕃薯藤執行長陳正然宣布合作華文全文搜尋服務 2000-12-20 經濟日報

    老派生活日曆✏一起來懷舊 >> http://bit.ly/2kMB8

    *********************************************

    歷史新聞節錄

    【2000-07-23/經濟日報/20版/】

    美夢成真
    Google雅虎新供應商

    對成立僅兩年的Google而言,美夢已成真。上月底,這家由一群史丹佛大學研究生創辦的加州小公司宣布,已獲選為頂尖入口網站雅虎公司(Yahoo!)搜尋引擎的新供應商,讓雅虎客戶用Google的軟體檢索網路資訊。

    勝利的果實嚐起來特別甜美,尤其因為Google以小搏大,擊敗網際網路搜尋引擎之星Ink-tomi而勝出。Inktomi的搜尋引擎服務廣獲各大型入口網站採用。

    雅虎共同創辦人楊致遠與費洛(David Filo)也到場與新盟友同歡,兩家公司的企業文化相當水乳交融,這或許是因為他們都自史丹佛大學校園構築起網路事業。

    但Google面臨的嚴肅問題是:贏得雅虎這紙合約,能不能為Google奠定稱霸新一代搜尋引擎軟體市場的基礎?Google能否壯大成另一網際網路巨人?

    第二個問題尚待Google首次公開發行股票時,再作評量。若IPO市場恢復熱絡,Google今年稍後可能掛牌上市。至於第一個問題,答案是:「也許。」

    雅虎當年以簡單的搜尋引擎起家,只列出數百個網站供初期網際網路使用者參考。如今,雅虎每月服務逾4,300萬人,可謂最成功的網際網路公司之一。在業務成長過程中,雅虎逐漸增加其他服務,包括免費電子郵件、線上購物與新聞內容等。

    然而,上網搜尋資料至今仍普受網友歡迎,卻也最令人氣餒。這是因為網際網路資訊何其多,如Google雖勉力製作約10億個網頁的索引,充其量也只能涵蓋估計總數的70%。所謂「估計」,是因為無人知曉究竟網路上有多少網頁、每天又增加多少。

    如何從浩瀚的網路尋得相關資訊,是搜尋引擎的一大挑戰。每種搜尋引擎都有獨特的索引方式,有的使用內含網頁說明的「後設標籤」(meta tags),有的將語多重覆的網頁關聯性降級,有的甚至為在所屬網站上打廣告的網頁宣傳。

    儘管搜尋引擎設計人員費盡心血,搜索網路資訊仍極耗時。每回搜尋得到的一大堆網址,需要使用者逐一點選過濾,未必能找到想要的資料。

    培巨說,Google的做法是「用複雜的軟體不斷分析搜尋結果並自我調整,裨能提供使用者最相關的網頁」。Google根據相關連結數目的多寡,藉以評定某網頁的關聯性,如獲被評為重要網頁引介,相關性進一步提升。如此一來,搜尋引擎回應的是網頁使用模式,而不落入網頁設計人員的圈套。

    【2000-12-20/經濟日報/29版/產業要聞】

    Google 搶進華文搜尋引擎市場
    與蕃薯藤聯手 明年來台設分公司 將在兩岸尋求策略夥伴

    全球當紅的網路搜尋引擎大廠,美國Google 公司昨(19)日宣布明年來台灣設分公司,並與蕃薯藤結盟進軍華文搜尋引擎市場。未來將在台灣與大陸尋求其他合適的策略夥伴,開拓兩岸簡體、繁體中文搜尋引擎市場的商機。

    Google 執行長貝吉(Larry Page)、業務行銷副總裁柯戴丹(Omid Kordestani) 昨天抵台,與蕃薯藤執行長陳正然、兩位副總經理詹東海與蕭景燈等代表共同簽約,蕃薯藤將採用Goole 的搜尋引擎平台,未來計劃進一步合作,開拓華文網路市場。

    他說,Google 並非入口網站,而是以開發網路搜尋技術平台為核心業務的網路軟體租賃商(ASP),透過授權其他網站使用其搜尋引擎技術,做為主要營收來源。除蕃薯藤外,Google不排除與國內其他網站合作。

    柯戴丹指出,提供搜尋引擎服務必須處理許多網頁內容,這些內容通常會有語言文化的隔閡與本地化(localize) 的需求,Google 要進入華文市場也須瞭解當地市場及競爭對手的動態。

你可能也想看看

搜尋相關網站