OpenXML定义
OpenXML(Office Open XML)是一种由微软开发的基于XML的文件格式规范,主要用于文档、电子表格和演示文稿等文件的存储。
它的文件扩展名包括.docx(Word文档)、.xlsx(Excel电子表格)和.pptx(PowerPoint演示文稿)等。OpenXML的设计目的是为了使文档能够以开放的标准格式存储,从而使不同的应用程序能够独立于专有格式操作这些文档,而不会丢失数据。
特点
- 基于XML:OpenXML使用XML格式来描述文档内容,这使得文档结构清晰且易于解析。
- 压缩存储:OpenXML文件采用ZIP格式进行压缩,能够显著减少文件大小,节省存储空间和传输带宽。
- 模块化结构:文件内部的不同数据组件被分开存储,这样即使某个组件损坏,其他部分仍然可以正常打开。
- 支持高级功能:许多Microsoft 365的高级功能要求文档以OpenXML格式存储,例如自动保存和辅助功能检查器。
定义
在 OpenXML(主要用于 Microsoft Office 文档格式,如 Word、Excel 和 PowerPoint)中,组件定义通常包括不同的 XML 元素和属性。以下是一些主要的组件定义,按文档类型分类:
OpenXML 的组件定义非常丰富,涵盖了文档结构的方方面面。每种文档类型都有其特定的元素和属性。要深入了解 OpenXML 组件,可以参考 ECMA-376 标准文档。
Word 文档(.docx)
- 文档主体
<w:document>
: 根元素,表示整个 Word 文档。<w:body>
: 文档的主体部分,包含段落、表格等。
- 段落
<w:p>
: 表示段落。<w:r>
: 表示文本运行(字符运行),包含样式和文本。<w:t>
: 表示文本内容。
- 表格
<w:tbl>
: 表示表格。<w:tr>
: 表示表格行。<w:tc>
: 表示表格单元格。
- 样式
<w:styles>
: 定义样式集合。<w:style>
: 定义单个样式。
- 页眉和页脚
<w:header>
: 页眉。<w:footer>
: 页脚。
- 超链接
<w:hyperlink>
: 超链接。
- 注释
<w:comment>
: 注释。
Excel 文档(.xlsx)
- 工作簿
<workbook>
: 根元素,表示整个工作簿。<sheets>
: 工作表集合。
- 工作表
<worksheet>
: 表示单个工作表。<sheetData>
: 工作表的数据部分。
- 单元格
<row>
: 表示一行。<c>
: 表示单元格。
- 样式
<cellXfs>
: 单元格样式集合。
- 合并单元格
<mergeCells>
: 合并单元格定义。
PowerPoint 文档(.pptx)
- 演示文稿
<ppt>
: 根元素,表示整个演示文稿。<slides>
: 幻灯片集合。
- 幻灯片
<slide>
: 表示单个幻灯片。<sp>
: 表示形状(图形、文本框等)。
文本框<txBody>
: 文本框的内容部分。
图像<blip>
: 表示图像。
共享组件
- 元数据
<coreProperties>
: 文档的核心属性,如标题、作者等。
- 关系
<Relationships>
: 定义文档中的关系,如图像、样式表等。
OpenXML定义
https://blog.cikaros.top/doc/f33c5a01.html