[爆卦]word轉html語法是什麼?優點缺點精華區懶人包

為什麼這篇word轉html語法鄉民發文收入到精華區:因為在word轉html語法這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者Hsins (迅雷不及掩耳盜鈴)看板LaTeX標題[心得] LaTeX 與 Word 格式轉換時...




如果使用 LaTeX 進行文章排版,但需要轉換 Word 格式的話,這篇可以稍微給
些概念跟幫助,但可能起不太到多大的作用…

【前言】

這邊不深入解釋兩者排版過程,只稍微提一下:

- LaTeX 是編輯 .tex 檔案撰寫 TeX 語法,最終透過不同發行版本將
他編譯成 .pdf 文件,
- Word 可以儲存成 .doc 或 .docx 文件,兩者本質上存在差異,互
相轉換的過程中有機率跑版。新版本都是使用 .docx 透過 XML 進
行編碼

兩者在儲存成 .pdf 文件之後基本上都無法逆推回原來的格式,尤其是碰到表格
、項目符號、文獻引用這類的非純粹文字格式內容。

也就是說:

轉換過程最多最多就是保持文字內容還在,其他部分內容都可能轉換失敗,需要
手動修改。


【Pandoc 使用教學】

不同的標註格式文件,有一個通用轉換的多平台 Command-Line 工具叫做 pandoc
由於沒有 GUI 介面,對於許多人來說可能不太友善。

一、安裝

微軟作業系統下可以用 scoop 或是 Chocolatey 安裝,也可以到官網下載編譯好
的 .msi 安裝文件無腦下一步。其他作業系統就採用常用的套件管理工具:

```
# mac OS
$ brew install pandoc

# Debian/Ubuntu
$ sudo apt install pandoc

# Arch Linux
$ sudo pacman -S pandoc

# Windows
$ scoop install pandoc
```

二、設定好文件樣式

先設定好 Word 的文件樣式方便轉換,並且儲存為一個範例文件
這個請參考:https://www.youtube.com/watch?v=hU-1vofgS3g

三、格式轉換

```
# 直接轉換,不在意格式(基本上類似複製下來貼到記事本啦…)
# 格式: pandoc <input.tex> -o <output.docx>
$ pandoc main.tex -o main.docx

# 使用模板,按照範例文件規定格式轉換
# 格式: pandoc <input.tex> --reference-doc=<template.docx> -o <output.docx>
$ pandoc main.tex --reference-doc=template.docx -o main.docx

# 指定 .bib 導入參考文獻
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx -o main.docx
```

四、進階操作

上述大概可以轉個 50% 吧…更多一點的就必須給定 LaTeX 引擎
文獻引用和圖片標註可以透過 filter 處理,以下是我常用的處理方式

```
$ pandoc main.tex --bibliography=references.bib
--reference-doc=template.docx
--filter=pandoc-crossref
--pdf-engine=xelatex
-o output.docx -w docx
```

其中關於 pandoc-crossref 可以從下面網址取得

https://github.com/lierdakil/pandoc-crossref 

直接到 release 頁面下載特定作業系統的進行安裝

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.37.86 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/LaTeX/M.1594850778.A.9FE.html
Hsins: 詳細的 pandoc 請參考 https://pandoc.org/MANUAL.html 07/16 06:07
ssweet: 感謝提供 07/16 19:20
st1009: 推推 07/17 07:10

你可能也想看看

搜尋相關網站