docling
docling简化了文档处理,解析各种格式(包括先进的PDF理解),并与AI Gen生态系统提供无缝集成。
特征
- 包括多个文档格式的解析。 PDF,DOCX,PPTX,XLSX,HTML,WAV,MP3,图像(PNG,TIFF,JPEG,…)等等
- ?先进的PDF理解包括。页面布局,阅读顺序,表结构,代码,公式,图像分类等等
- ?统一的docling文档表示形式格式
- ↪️各种出口格式和选项,包括Markdown,HTML,Doctags和无损JSON
- 敏感数据和空气环境的本地执行功能
- ?即插即用集成包含。 Langchain,Llamaindex,Ai&Haystack for AgentiC AI
- ?对扫描PDF和图像的大量OCR支持
- ?支持几种视觉语言模型(SMOL docling )
- ?️支持自动语音识别(ASR)模型的音频支持
- 简单便捷的CLI
即将推出
- 元数据提取,包括标题,作者,参考和语言
- 图表理解(Barchart,Piechart,Lineplot等)
- 复杂的化学理解(分子结构)
安装
要使用docling ,只需从包装管理器中安装docling ,例如PIP:
pip install docling
在MacOS,Linux和Windows环境上工作。 X86_64和ARM64架构。
文档中提供了更详细的安装说明。
入门
要使用Python转换单个文档,请使用Convert(),例如:
docling.document_converter import DocumentConverter
source = \”https://arxiv.org***/pdf/2408.09869\” # document per local path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown()) # output: \”## docling Technical Report[…]\”\”>
from docling . document_converter import DocumentConverter source = \"https://arxiv.org***/pdf/2408.09869\" # document per local path or URL converter = DocumentConverter () result = converter . convert ( source ) print ( result . document . export_to_markdown ()) # output: \"## docling Technical Report[...]\"
文档中提供了更高级的用法选项。
CLI
docling具有内置的CLI进行转换。
docling https://a*rxi*v.or*g/pdf/2206.01062
您也可以通过docling CLI使用?Smol docling和其他VLM:
docling https://a*rxi*v.or*g/pdf/2206.01062\”>
docling --pipeline vlm --vlm-model smol docling https://a*rxi*v.or*g/pdf/2206.01062
这将在支持的苹果硅硬件上使用MLX加速度。
在这里阅读更多
文档
查看docling的文档,以获取有关安装,使用,概念,食谱,扩展等的详细信息。
例子
进行我们的示例操作,演示如何与docling解决不同的应用程序用例。
集成
为了进一步加速您的AI应用程序开发,请查看docling与流行框架和工具的本地集成。
获得帮助和支持
请随时使用讨论部分与我们建立联系。
技术报告
有关docling的内部工作的更多详细信息,请查看docling技术报告。
贡献
请阅读有关详细docling的贡献。
参考
如果您在项目中使用docling ,请考虑以下内容:
docling,
author = {Deep Search Team},
month = {8},
title = { docling Technical Report},
url = {https://arxi*v.o*rg/*abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}\”>
@techreport { docling , author = { Deep Search Team } , month = { 8 } , title = { docling Technical Report } , url = { https://a*rx*iv.or*g/abs/2408.09869 } , eprint = { 2408.09869 } , doi = { 10.48550/arXiv.2408.09869 } , version = { 1.0.0 } , year = { 2024 } }
执照
docling代码库符合MIT许可。对于单个模型使用情况,请参阅原始软件包中的模型许可证。
LF AI和数据
docling作为LF AI&Data Foundation的项目托管。
IBM❤️开源AI
该项目是由IBM Research Zurich的AI知识团队启动的。
