Wordファイル(.docx)をMarkdownへ変換する

Home   »   Wordファイル(.docx)をMarkdownへ変換する

```
$ pandoc -s .docx --wrap=none --reference-links --extract-media=media -t gfm --filter ./despan.py -o .md
```

いろいろと試した挙句、下記の観点でこれがベスト。
- `--wrap=none` 勝手にwrapさせたくない(defaultではwrapしてしまう)
- `--reference-links` 
- `--extract-media=media` docxに埋め込まれたpngなどを抽出できる
- `-t gfm` github形式のmarkdownで出力したい(tableがpandoc defaultのmarkdownは他の形式になってしまう)

> ref: [Pandoc - Pandoc User’s Guide](https://pandoc.org/MANUAL.html)


> ref: [How to remove title anchor when converting docx to markdown? · Issue #1893 · jgm/pandoc](https://github.com/jgm/pandoc/issues/1893)

- filterを使い、title anchorを削除する

Leave a Reply

Your email address will not be published. Required fields are marked *