世界史语料集
世界史语料集是一个围绕世界历史领域构建的大规模、高质量文本与多模态知识库,整合了涵盖全球多地区、多语种的权威文献与历史影像资源。该语料集深度覆盖从人类起源到当代社会的政治、经济、文化、科技等多维度历史脉络,通过结构化的历史事件链、文明比较视角与跨文化关联特征,为大模型提供宏大的时空视野与深度的因果推理素材。其知识密集、时序连贯的特性能够有效训练模型理解长时段文明演进、分析国际体系变迁,显著增强模型在历史推理、跨文化理解和复杂叙事生成等方面的认知能力。
64704本
本语料集收录了涵盖全球多个地区、多个历史时期的丰富文献资源,包括专著、传记、历史研究、回忆录、期刊文章等多种类型的出版物。该语料集语种多样,包括英文、中文、德文、俄文、日文等内容,涉及政治、经济、文化、社会、军事、宗教、科技、艺术等多个领域。该语料具备知识密集、跨文化关联等特性,能够为大模型提供结构化的历史常识、事件因果链条及文明演进脉络,有效支撑历史推理、时序理解、跨文化分析等复杂认知能力的训练与优化。
1337个
本世界史视频语料集整合了从人类起源、史前文明到中世纪全球格局演变的宏大叙事,为大规模语言模型提供了跨越时空、文明与学科的宏大视野与结构化历史知识;该数据集能有效训练模型理解长时段历史演化规律、文明比较视角及国际体系变迁的复杂因果关系,弥补通用模型在宏观历史叙事与跨文明分析上的逻辑短板,是构建具备全球史观和深度推理能力大模型的关键训练素材。
样例
样例