OpenXML定义

OpenXML(Office Open XML)是一种由微软开发的基于XML的文件格式规范,主要用于文档、电子表格和演示文稿等文件的存储。

它的文件扩展名包括.docx(Word文档)、.xlsx(Excel电子表格)和.pptx(PowerPoint演示文稿)等。OpenXML的设计目的是为了使文档能够以开放的标准格式存储,从而使不同的应用程序能够独立于专有格式操作这些文档,而不会丢失数据。

特点

  1. 基于XML:OpenXML使用XML格式来描述文档内容,这使得文档结构清晰且易于解析。
  2. 压缩存储:OpenXML文件采用ZIP格式进行压缩,能够显著减少文件大小,节省存储空间和传输带宽。
  3. 模块化结构:文件内部的不同数据组件被分开存储,这样即使某个组件损坏,其他部分仍然可以正常打开。
  4. 支持高级功能:许多Microsoft 365的高级功能要求文档以OpenXML格式存储,例如自动保存和辅助功能检查器。

定义

在 OpenXML(主要用于 Microsoft Office 文档格式,如 Word、Excel 和 PowerPoint)中,组件定义通常包括不同的 XML 元素和属性。以下是一些主要的组件定义,按文档类型分类:

OpenXML 的组件定义非常丰富,涵盖了文档结构的方方面面。每种文档类型都有其特定的元素和属性。要深入了解 OpenXML 组件,可以参考 ECMA-376 标准文档。

Word 文档(.docx)

  • 文档主体
    • <w:document>: 根元素,表示整个 Word 文档。
    • <w:body>: 文档的主体部分,包含段落、表格等。
  • 段落
    • <w:p>: 表示段落。
    • <w:r>: 表示文本运行(字符运行),包含样式和文本。
    • <w:t>: 表示文本内容。
  • 表格
    • <w:tbl>: 表示表格。
    • <w:tr>: 表示表格行。
    • <w:tc>: 表示表格单元格。
  • 样式
    • <w:styles>: 定义样式集合。
    • <w:style>: 定义单个样式。
  • 页眉和页脚
    • <w:header>: 页眉。
    • <w:footer>: 页脚。
  • 超链接
    • <w:hyperlink>: 超链接。
  • 注释
    • <w:comment>: 注释。

Excel 文档(.xlsx)

  • 工作簿
    • <workbook>: 根元素,表示整个工作簿。
    • <sheets>: 工作表集合。
  • 工作表
    • <worksheet>: 表示单个工作表。
    • <sheetData>: 工作表的数据部分。
  • 单元格
    • <row>: 表示一行。
    • <c>: 表示单元格。
  • 样式
    • <cellXfs>: 单元格样式集合。
  • 合并单元格
    • <mergeCells>: 合并单元格定义。

PowerPoint 文档(.pptx)

  • 演示文稿
    • <ppt>: 根元素,表示整个演示文稿。
    • <slides>: 幻灯片集合。
  • 幻灯片
    • <slide>: 表示单个幻灯片。
    • <sp>: 表示形状(图形、文本框等)。
      文本框
    • <txBody>: 文本框的内容部分。
      图像
    • <blip>: 表示图像。

共享组件

  • 元数据
    • <coreProperties>: 文档的核心属性,如标题、作者等。
  • 关系
    • <Relationships>: 定义文档中的关系,如图像、样式表等。

OpenXML定义
https://blog.cikaros.top/doc/f33c5a01.html
作者
Cikaros
发布于
2025年3月3日
许可协议