[爆卦]as詞性是什麼?優點缺點精華區懶人包

雖然這篇as詞性鄉民發文沒有被收入到精華區:在as詞性這個話題中,我們另外找到其它相關的精選爆讚文章

在 as詞性產品中有16篇Facebook貼文,粉絲數超過12萬的網紅浩爾譯世界,也在其Facebook貼文中提到, 【如何用好的英文,發揮超大影響力?】 如果請你用 50 個英文字 描述一下正在使用的手機 你會怎麼寫呢? 來看英文寫作權威 Sonny老師的翻譯&教學札記 專業解析 以下為 Sonny 老師第一人稱視角 - 多年前 iPhone 6 剛出品時 英國專業評論家 Evan Kypreos 寫了一篇...

 同時也有2部Youtube影片,追蹤數超過14萬的網紅Ricky英語小蛋糕,也在其Youtube影片中提到,may well / may as well 意思差很多?!!【文法關鍵比一比】Ricky//英語小蛋糕 【Ricky 英語小蛋糕 🍰 x 自然學文法線上課程問卷】 問卷連結:https://www.surveycake.com/s/2xoW2 ※協助填寫的朋友們,除了能在開課時收到最優惠價格的通...

  • as詞性 在 浩爾譯世界 Facebook 的精選貼文

    2021-04-14 21:40:48
    有 276 人按讚

    【如何用好的英文,發揮超大影響力?】
    如果請你用 50 個英文字
    描述一下正在使用的手機
    你會怎麼寫呢?

    來看英文寫作權威 Sonny老師的翻譯&教學札記 專業解析
    以下為 Sonny 老師第一人稱視角

    -

    多年前 iPhone 6 剛出品時
    英國專業評論家 Evan Kypreos
    寫了一篇字字珠璣的產品評論
    獲得極高的點閱率和討論度
    是用文字發揮強大影響力的一個例子
    讓我們一起來觀摩幾個精彩的句子:

    1️⃣ The iPhone 6 opts for soft curves and seamless joins between the screen and the back.
    (iPhone 6 選擇了柔和曲線,螢幕和背面一體成型。)

    👉 動詞用了 opt (v.) 選擇,在視覺上或發音上都簡短有力
    👉 seam 指「縫隙」,因此 seamless 意即「無縫隙的」
    👉 把 join 轉為名詞用,意指「結合(處)」
    👉 第一句就可看出作者對英文詞性強大的駕馭功力

    2️⃣ As always with Apple’s phones the iPhone 6 has superb balance, it just feels right in your hand.
    (一如其他蘋果手機,iPhone 6 的平衡也相當突出,手感相當卓越。)

    👉 句首用 as always with 三字簡單推一下蘋果先前的作品
    👉 superb (卓越、超凡)這個字選得非常好,比使用其他形容詞最高級更為精準有力
    👉 句尾使用較口語的用法 feel right in your hand,讓文風活潑些

    3️⃣ The 6.9mm thickness makes it feel sleek yet strong.
    (6.9 mm 的厚度使它既雅緻,又耐用。)

    👉 英文評論或文宣很強調「數據」或「資訊」,而這個句子完美帶入確切的數據,提升讀者的信任感
    👉 iPhone 6 的厚度比前幾代都還薄,但與其用 thin 這個比較平凡的字,作者選了 sleek,把「薄」轉成一種正面的印象(雅緻),別具巧思
    👉 sleek 和 strong 都是 s 開頭,押頭韻,能加深讀者的印象

    讀到這裡,大家是否覺得十分驚艷呢?
    好的英文寫手,都如這位專家一般
    能把精湛的寫作技巧和縝密的思維
    用兩三個句子就表達得淋漓盡致!

    -

    你也想用好的英文寫作,創造影響力嗎?

    歡迎加入Sonny 老師的線上課程
    《全方位的情境寫作術》 ✏️
    募資進入 #最後1天🔥,現省670元
    想要提升國際競爭力的朋友把握機會!
    手刀加入:https://reurl.cc/WEVQLy

    #小編強力推薦
    #學寫作首選Sonny老師
    #寫作力就是你的影響力

  • as詞性 在 大詩人的寂寞投資筆記 Facebook 的最讚貼文

    2020-08-19 12:20:27
    有 64 人按讚


    各種場合的《錢》代用詞(請忽略詞性)

    A. 我們要的就是一個「誠意」。(=錢)

    B. 你到底有沒有「心」要解決?(=錢)

    C. 你有多少「預算」?(=錢)

    D. 接下來就看你怎麼「表示」了。(=錢)

    E. 這是一點「小意思」。(=錢)

    F. 我愛的是他的「全部」。(=錢)

    G. 被告深具「悔意」。(=錢)

    H. 被告與告訴人已達成「和解」。(=錢)

    I. 佛要金裝,人要「衣裝」。(=錢)

    J. 請讓我一輩子「照顧」妳吧!(=錢)

    K. 你要給我女兒一個「交代」!(=錢)

    L. 這種事情講求的是「緣分」。(=錢)

    M. 我們爭的是「尊嚴」!(=錢)

    N. 小孩子長大要懂得「孝順」父母。(=錢)

    O. 施主「功德」無量。(=錢)

    P. 我希望我的對象要有「上進心」。(=錢)

    Q. 男人要「大氣」一點。(=錢)

    R. 你難道覺得你一點「責任」都沒有?(=錢)

    S. 我什麼都不要,只要你對我「好」。(=錢)

    T. 生活只要能過得「自由自在」就好了。(=錢)

    U. 我們現在採取的方案是「免試多元」入學。(=錢)

    V. 「凍蒜」!(=錢)

    W. 我都是為了「做公益」。(=錢)

    X. 我們還沒有達成「共識」。(=錢)

    Y. 這件事你去「喬」一下。(=錢)

    Z. 你到底會不會「做人」啊?(=錢)

    AA. 做生意「門面」要先擺出來。(=錢)

    AB. 這事情「處理」起來可大可小。(=錢)

    AC. 我們公司要善盡「企業社會責任」。(=錢)

    AD. 我想離職是因為我覺得在這邊不受「重視」。(=錢)

    AE. 我們要突破我們的「外交」困境。(=錢)

    AF. 我不能接受的是你的「態度」。(=錢)

    AG. 做人就是要「開心」。(=錢)

    AH. 爸媽我決定「專心」準備考公務員。(=錢)

    AI. 可以幫我「衝」個業績嗎?(=錢)

    AJ. 你讓我很沒有「安全感」。(=錢)

    AK. 「限量」是殘酷的。(=錢)

    AL. 這就要比一比誰的「口袋」深了。(=錢)

    AM. 不要讓您的孩子「輸」在起跑點。(=錢)

    AN. 因為你是我們的VIP,我們正好有一個針對貴賓的「活動」。(=錢)

    AO. 不能看在我們的「交情」上嗎?(=錢)

    AP. 我們賣的不是車,是一個「家的感覺」。(=錢)

    AQ. 我們提供「Total Solution」。(=錢)

    AR. 您的「整體持有」成本是低的。(=錢)

    AS. 為什麼你這個男人一點「肩膀」都沒有?(=錢)

    AT. 您看一下是不是還有「空間」?(=錢)

    AU. 我這邊有一個很棒的「機會」。(=錢)

    AV. 這個硬體需要「升級」。(=錢)

    AW. 能不能讓我「週轉」一下?(=錢)

    AX. 這間廟「香火」鼎盛。(=錢)

    AY. 愛情和「麵包」哪個重要?(=錢)

    AZ. 我不是為了別的,是為了「理念」。(=錢)。

    BA. 我接案是基於「道義」。(=錢)

  • as詞性 在 李開復 Kai-Fu Lee Facebook 的精選貼文

    2020-07-08 18:00:23
    有 315 人按讚

    來自創新工場大灣區人工智慧研究院的兩篇論文入選了自然語言處理領域(NLP)頂級學術會議 ACL 2020 。
    這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。

    本文來自創新工場公眾號
    ……………………………………………………………………

    創新工場兩篇論文入選ACL 2020,將中文分詞性能刷至新高

    “土地,我的金箍棒在哪裡?”
    “大聖,你的金箍,棒就棒在,特別配你的髮型。”

    感謝神奇的中文分詞,給我們帶來了多少樂趣。豐富多變的中文行文,給人的理解造成歧義,也給AI分詞帶來挑戰。

    近日,自然語言處理領域(NLP)頂級學術會議 ACL 2020 (https://acl2020.org/)正在火熱舉行。

    令人振奮的是,來自創新工場大灣區人工智慧研究院的兩篇論文入選。這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。

    分詞及詞性標注是中文自然語言處理的基本任務,尤其在工業場景對分詞有非常直接的訴求,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。

    基於此,兩篇論文各自提出了“鍵-值記憶神經網路的中文分詞模型”和“基於雙通道注意力機制的分詞及詞性標注模型”,將外部知識(資訊)創造性融入分詞及詞性標注模型,有效剔除了分詞“噪音”誤導,大幅度提升了分詞及詞性標注效果。

    兩篇文章的作者有:華盛頓大學博士研究生、創新工場實習生田元賀,創新工場大灣區人工智慧研究院執行院長宋彥,創新工場科研合夥人張潼,創新工場CTO兼人工智慧工程院執行院長王詠剛等人。

    ACL(The Association for ComputationalLinguistics)國際計算語言學協會是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自1962年創立以來已有58年歷史,其每年夏天舉辦的年會是該領域學術頂會。

    與往年不同的是,受新冠疫情影響,ACL2020全部轉為線上進行,不過這絲毫沒有減弱熱度。根據之前公佈的資料,今年大會投稿數量超過3000篇,共接收 779 篇論文,包括 571 篇長論文和 208 篇短論文,接收率為 25.2%,在全球疫情衝擊下反而是有史以來最盛大的一屆ACL會議,創新工場的技術大牛們也頂著時差連續數晚熬夜參會。

    ▌利用記憶神經網路,將中文分詞性能刷到歷史新高

    中文分詞目的是在中文的字序列中插入分隔符號,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”(“/”表示分隔符號)。

    中文語言因其特殊性,在分詞時面臨著兩個主要難點。一是歧義問題,由於中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水準”,其正確的切分應為“部分/居民/生活/水準”,但存在“分居”、“民生”等歧義詞。“他從小學電腦技術”,正確的分詞是:他/從小/學/電腦技術,但也存在“小學”這種歧義詞。

    二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。例如經濟、醫療、科技等科學領域的專業術語或者社交媒體上的新詞,或者是人名。這類問題在跨領域分詞任務中尤其明顯。

    對此,《ImprovingChinese Word Segmentation with Wordhood Memory Networks》這篇論文提出了基於鍵-值記憶神經網路的中文分詞模型。

    該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水準”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。並通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。

    例如,在“部分居民生活水準”這句話中,到底有多少可能成為詞的組塊?單字可成詞,如“民”;每兩個字的組合可能成詞,如“居民”;甚至四個字的組合也可能成詞,例如“居民生活”。

    把這些可能成詞的組合全部找到以後,加入到該分詞模型中。通過神經網路,學習哪些詞對於最後完整表達句意的幫助更大,進而分配不同的權重。像“部分”、“居民”、“生活”、“水準”這些詞都會被突出出來,但“分居”、“民生”這些詞就會被降權處理,從而預測出正確的結果。
    在“他從小學電腦技術” 這句話中,對於有歧義的部分“從小學”(有“從/小學”和“從小/學”兩種分法),該模型能夠對“從小”和“學”分配更高的權重,而對錯誤的n元組——“小學”分配較低的權重。

    為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。

    實驗結果顯示,該模型在5個資料集(MSR、PKU、AS、CityU、CTB6)上的表現,均達了最好的成績(F值越高,性能越好)。(注:所選擇的五個資料集是中文分詞領域目前全世界唯一通用的標準資料集)

    創新工場大灣區人工智慧研究院執行院長宋彥表示,與前人的模型進行比較發現,該模型在所有資料集上的表現均超過了之前的工作,“把中文分詞領域廣泛使用的標準資料集上的性能全部刷到了新高。”

    在跨領域實驗中,論文使用網路博客資料集(CTB7)測試。實驗結果顯示,在整體F值以及未登陸詞的召回率上都有比較大提升。

    ▌“雙通道注意力機制”,有效剔除“噪音”誤導

    第二篇論文《Joint ChineseWord Segmentation and Part-of-speech Tagging via Two-way Attentions ofAuto-analyzed Knowledge》提供了一種基於雙通道注意力機制的分詞及詞性標注模型。

    中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對後續的句子理解有重要的作用。

    在詞性標注中,歧義仍然是個老大難的問題。例如,對於“他要向全班同學報告書上的內容”中,“報告書”的正確的切分和標注應為“報告_VV/書_N”。但由於“報告書”本身也是一個常見詞,一般的工具可能會將其標注為“報告書_NN”。

    句法標注本身需要大量的時間和人力成本。在以往的標注工作中,使用外部自動工具獲取句法知識是主流方法。在這種情況下,如果模型不能識別並正確處理帶有雜音的句法知識,很可能會被不準確的句法知識誤導,做出錯誤的預測。

    例如,在句子“他馬上功夫很好”中,“馬”和“上”應該分開(正確的標注應為“馬_NN/上_NN”)。但按照一般的句法知識,卻可能得到不準確的切分及句法關係,如“馬上”。

    針對這一問題,該論文提出了一個基於雙通道注意力機制的分詞及詞性標注模型。該模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特徵和句法知識加權,預測每個字的分詞和詞性標籤,不同的上下文特徵和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特徵和句法知識的貢獻。

    這樣一來,那些不準確的,對模型預測貢獻小的上下文特徵和句法知識就能被識別出來,並被分配小的權重,從而避免模型被這些有噪音的資訊誤導。

    即便在自動獲取的句法知識不準確的時候,該模型仍能有效識別並利用這種知識。例如,將前文有歧義、句法知識不準確的句子(“他馬上功夫很好”),輸入該雙通道注意力模型後,便得到了正確的分詞和詞性標注結果。

    為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。

    一般領域實驗結果顯示,該模型在5個資料集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作,也大幅度超過了斯坦福大學的 CoreNLP 工具,和伯克利大學的句法分析器。

    即使是在與CTB詞性標注規範不同的UD資料集中,該模型依然能吸收不同標注帶來的知識,並使用這種知識,得到更好的效果。

    而在跨領域的實驗中,和斯坦福大學的CoreNLP 工具相比,該模型也有近10個百分點的提升。

    ▌主動引入和分辨知識,實現中文分詞技術突破

    中文分詞在中國科研領域已經有幾十年的歷史。最初的中文分詞是基於詞典構建,詞典的好壞會直接影響到最後分析的效果。如果某個新詞在詞典裡沒有,那麼模型是死活都分不出來的。

    這種方式的局限性還在於,詞典和分詞兩件事情中間始終有一條鴻溝,儘管詞典可以編撰得非常全面,但在處理分詞的時候,因為每一句話都有上下文語境,往往會產生多種不同的切分方法,從而無法有效地在當前語境下對分詞結構進行恰當的指導。

    從2003年開始,分詞方法出現了新的突破。研究人員提出了打標籤的方式,通過給每一個字打詞首、詞尾、詞中的標籤,不再需要構建詞典,大幅度提升了未登錄詞的召回效果。

    到了2014年左右,深度學習和神經網路開始被廣泛應用到中文分詞中,打標籤的模型從之前的淺層學習變成了深度學習,但演算法本質沒有發生變化,所以提升作用並不太大。

    近兩年,學界開始研究怎麼在打標籤的過程中加入外部知識和資訊。創新工場的這兩篇文章就是沿著這個路徑,用記憶神經網路的方式記錄對分詞結果有影響的 n元組,並引入對詞性標注有影響的句法知識,將分詞結果和自動獲得的知識銜接起來,既發揮了神經網路的優勢,也把知識的優勢用上,實現了分詞技術上小而有效的改進和突破。

    宋彥表示,“從技術創新的角度,我們的貢獻主要有兩點。一是在現有技術的基礎上,建立了一個一體化的模型框架,使用非監督方法構建詞表,並把知識(資訊)融入進來,使用更高層次的句法知識,來幫助詞性標注,起到'他山之石,可以攻玉’的效果。”

    “二是主動吸收和分辨不同的外部知識(資訊)。通過鍵-值記憶神經網路和雙通道注意力機制,進行動態權重的分配,能夠有效分辨知識,區分哪些是有效的,哪些是無效的。雖然這些知識是自動獲取的、不準確的,但‘三個臭皮匠,頂個諸葛亮’,經過有效利用,總能湊出一些有用的資訊。如何實現模型的主動吸收和分辨,就變得更加重要。”

    據瞭解,今年的ACL大會,在分詞領域一共收錄了18篇論文,創新工場人工智慧工程院同時有2篇入選,也表現出ACL官方對這一貢獻的認可。

    ▌具備跨領域分詞能力,提升工業應用效率

    中文分詞和詞性標注是最底層的應用,對於接下來的應用和任務處理非常重要。例如對於文本分類、情感分析,文本摘要、機器翻譯等,分詞都是不可或缺的基本“元件”。

    宋彥表示,做此項研究的目的是主要為了拓展其工業場景的應用,正確的分詞能夠平衡公司應用開發的效率和性能,同時方便人工干預及(預)後處理。

    這也是創新工場人工智慧工程院的努力方向之一。工程院成立於2016年9月,宗旨是銜接科技創新和行業賦能,做嫁接科研和產業應用的橋樑,為行業改造業務流程、提升業務效率。

    工程院下設北京總部、南京研究院和大灣區研究院。大灣區研究院再下設資訊感知和理解實驗室,專注于對自然語言處理(NLP)領域的研究。執行院長宋彥本人也有超過15年的NLP領域的科研經驗。

    “在工業場景使用的時候,跨領域的模型能力是一個非常直接的訴求。”宋彥表示,在某個領域的訓練模型,大概率也需要應用到其他領域。

    “如何在新領域缺少資料,或者新領域只有少量未標注資料的情況下,實現模型的冷開機,依然是項巨大的挑戰。如果能利用外部知識,提高模型性能,就能有效地召回很多在訓練集中沒有出現過的新詞。”

    例如搜尋引擎的廣告系統,最初也是通過組詞匹配的方式,在某個特定領域訓練其分詞模型,但在進入一個新的領域時,例如從新聞領域進入醫療領域或體育領域,效果往往會大打折扣,甚至頻頻出錯。

    而使用跨領域特性後,廣告系統在進入新領域時,便無需額外的資料,就可以對它進行比較準確的分詞和標注,從而有效匹配廣告和客戶,大大提升系統運行的效率和穩定性。

    目前,這兩篇論文的工具都已經開源,在下面兩個連結中,可以找到對應的所有代碼和模型,各位朋友可按需自取:

    分詞工具:https://github.com/SVAIGBA/WMSeg
    分詞及詞性標注工具:https://github.com/SVAIGBA/TwASP

你可能也想看看

搜尋相關網站