How to obtain a txt document #142

liepinlxy · 2024-10-10T08:36:19Z

I hope to obtain the txt text content after parsing the pdf. How should I do it?

myhloli · 2024-10-10T08:39:34Z

liepinlxy · 2024-10-10T09:03:34Z

谢谢，我之前看过这个项目的介绍，发现转换出来的是markdown 格式，我其实只关心按照pdf内容顺序提取出来纯文本就可以了，MinerU可以支持么？

myhloli · 2024-10-10T09:06:00Z

谢谢，我之前看过这个项目的介绍，发现转换出来的是markdown 格式，我其实只关心按照pdf内容顺序提取出来纯文本就可以了，MinerU可以支持么？

markdown和文本的区别是？

liepinlxy · 2024-10-10T09:15:06Z

谢谢，我之前看过这个项目的介绍，发现转换出来的是markdown 格式，我其实只关心按照pdf内容顺序提取出来纯文本就可以了，MinerU可以支持么？

markdown和文本的区别是？

懂你意思了，我先尝试一下

Provide feedback