学科导航

12条记录

  • 基础医学语料集
    摘要: 基础医学语料集是一个围绕基础医学领域构建的文本与视频资源集合,内容涵盖解剖学、生理学、病理学等多个关键学科。语料来源广泛且权威,包括医学教材、学术论文、临床指南、专业文献,以及全球顶尖高校和知名学者的专业课程、专题讲座等体系化教学资源。该语料集具有内容专业、结构完整、讲解清晰等特点,为医学自然语言处理模型训练、语义分析及医学教育大模型训练等多种智能医学应用提供高质量的数据支撑,是连接基础医学研究与人工智能技术发展的重要数据基础。
    图书:11494本 视频:163个
    详情
  • 法学语料集
    摘要: 法学语料集是一个整合专著与学术论文的大规模资源集合,系统性地收录了核心法学图书以及大量期刊、会议与学位论文。语料来源权威全面,既汇聚了法律出版社等国内核心出版机构的经典专著,也涵盖了核心法学期刊等前沿学术成果,内容涉及民法、刑法、诉讼法、国际法及法哲学等关键领域。该语料集不仅为法学研究与教育提供了坚实的文献基础,更能为法律智能问答、类案推送、文献挖掘及法律大模型训练等智慧司法应用提供高质量、多类型的文本数据支撑,是连接法学与人工智能技术发展的重要数据基础。
    图书:20986本 论文:133178篇
    详情
  • 人工智能语料集
    摘要: 人工智能语料集是一个融合学术文献与教学资源的多模态数据集合,系统整合了人工智能领域的核心知识内容。其文献部分基于严谨的文献计量方法构建,收录了2014-2023年间来自Web of Science数据库的160余万篇论文元数据,完整覆盖人工智能各主要研究方向,为领域发展研究提供权威的学术数据支撑。视频部分则包含从基础编程到前沿算法的系统化教学资源,兼具专业深度与普及性,形成层次丰富的学习体系。本语料集支持学科知识图谱构建、研究趋势分析和领域大模型训练等科研需求,满足智能教学系统开发、课程资源生成等教育应用场景,为推进人工智能领域的学术研究、技术普及与教育创新提供全面可靠的数据基础。
    论文:1601483篇 视频:95个
    详情
  • 数学语料集
    摘要: 数学语料集是围绕数学学科构建的大规模专业文本集合,主要涵盖开放获取(OA)学术论文和Web of Science核心数据库中收录的高质量数学研究文献。语料来源权威可靠,包括众多知名数学期刊与会议论文,内容覆盖纯数学、应用数学、统计学等多个子领域。该资源可用于支持数学文献智能检索与推荐系统,提升研究者文献查阅效率;服务于数学问题自动求解、公式生成与知识挖掘工具的开发;同时为数学研究趋势分析、学科知识图谱构建提供数据基础,推动数学科学研究的智能化发展。
    论文:628833篇
    详情
  • 化学语料集
    摘要: 化学语料集是一个系统构建的大型专业化文本资源,整合了来自开放获取(OA)学术论文等来源的高质量化学文献,重点收录部分国际知名出版社权威期刊的多种类型文献,涵盖无机化学、有机化学、物理化学、分析化学、生物化学等重要分支。该语料库以结构化元数据为基础框架,深度融合引文网络与开放获取全文资源,具备术语精准、结构规范、信息完备的特点,可广泛用于化学信息检索、分子属性预测、文献自动摘要、知识图谱构建及智能合成路线设计等任务,为化学科学与人工智能应用的交叉创新提供可靠数据基础。
    论文:7789102篇
    详情
  • 人文艺术语料集
    摘要: 本语料集是一个面向人文与艺术领域系统构建的大规模学术文本资源,核心内容集成自全球多种开放获取(OA)学术论文。语料广泛涵盖文学、历史、哲学、艺术理论、音乐学、影视研究、文化批评等多个重要分支,包含期刊论文、学术专著、会议报告等多种文献类型。语料集具备分类清晰、文本质量高的特点。该资源可用于支持人文艺术文献的智能检索与知识发现,训练领域特定的文本分析与生成模型,辅助数字人文研究中的趋势挖掘与观念演化分析,并为艺术创作与批评的智能化应用提供高质量的文本数据支撑。
    论文:200000篇
    详情
  • 教育学语料集
    摘要: 教育学语料集是一个整合学术论文与研究成果的大规模资源集合,系统收录了来自《Review of Educational Research》、《Computers & Education》、《Learning and Instruction》等2400余种权威期刊的120万篇开放获取论文,涵盖教育心理学、教育技术学及多个学科教育等核心领域,并通过深度结构化的元数据体系构建出完整的学术信息网络——每条记录在包含完整书目信息的基础上,更集成了专业分类标引与引文网络数据,形成一个语义密集的教育学知识体系,为教育文本智能处理、学术影响力分析与个性化推荐系统等研究提供高质量数据支撑。
    论文:2400000篇
    详情
  • 物理学语料集
    摘要: 物理学语料集是一个系统构建的大型专业化文本资源,整合了来自开放获取学术论文等来源的高质量物理学文献,重点收录《Physical Review X》《Light: Science & Applications》《npj Quantum Information》等权威期刊的多种类型文献,涵盖凝聚态物理、高能物理、量子信息、光学与光子学等重要分支。该语料库以结构化元数据为基础框架,深度融合引文网络与开放获取全文资源,具备术语精准、结构规范、信息完备的特点,可广泛用于物理文献智能检索、理论方法分类、实验数据挖掘以及跨学科交叉研究等任务,为物理学与人工智能技术的深度融合提供可靠数据基础。
    论文:5330000篇
    详情
  • 心理学语料集
    摘要: 心理学语料集是一个系统构建的大型专业化文本资源,整合了来自开放获取学术论文等来源的高质量心理学文献,重点收录《Social Cognitive and Affective Neuroscience》《Acta Psychologica》《Journal of Behavioral Addictions》等权威期刊的多种类型文献,涵盖认知心理学、临床心理学、发展心理学、社会心理学及健康心理学等重要分支。该语料库以结构化元数据为基础框架,深度融合引文网络与开放获取全文资源,具备术语精准、结构规范、信息完备的特点,可广泛用于心理学文献智能检索、研究范式识别、理论模型验证以及心理状态评估建模等任务,为心理学研究与人工智能技术的深度交叉融合提供可靠数据基础。
    论文:1600000篇
    详情
  • 考古学语料集
    摘要: 考古学语料集是一个围绕考古学领域系统构建的高质量、多模态数据集。它系统整合了超过一万册从19世纪至今的权威考古文献与系统性的视频课程,内容贯通金石、陶瓷、敦煌、简帛等核心领域与史前考古、断代方法、古人类学等研究方法论。该数据集兼具广博的史料覆盖与深度的逻辑推理框架,能为大模型提供从专业术语、跨文化知识到科学实证与长链推理的全方位训练素材,旨在从根本上增强模型在考古文献解析、学术问答及研究辅助中的专业性能与准确性。
    图书:11118本 视频:121个
    详情
  • 世界史语料集
    摘要: 世界史语料集是一个围绕世界历史领域构建的大规模、高质量文本与多模态知识库,整合了涵盖全球多地区、多语种的权威文献与历史影像资源。该语料集深度覆盖从人类起源到当代社会的政治、经济、文化、科技等多维度历史脉络,通过结构化的历史事件链、文明比较视角与跨文化关联特征,为大模型提供宏大的时空视野与深度的因果推理素材。其知识密集、时序连贯的特性能够有效训练模型理解长时段文明演进、分析国际体系变迁,显著增强模型在历史推理、跨文化理解和复杂叙事生成等方面的认知能力。
    图书:64704本 视频:1337个
    详情
  • 中国史语料集
    摘要: 中国史语料集是一个专为训练高水平中文大模型设计的大规模、多模态数据集,核心价值在于将超过10万册权威历史文献与800余个体系化专家讲座视频深度融合,构建了从先秦至近现代的完整知识图谱。该语料集不仅提供涵盖政治、经济、文化等多维度的海量文本素材,富含明确时序信息与多样化语言风格,更通过专家视频内容强化了复杂历史脉络的因果推理训练。其中“晚清画报”等特色资源兼具图文对齐潜力,为提升模型的历史知识准确性、长上下文推理能力和多模态理解提供了全面而坚实的训练基础。
    图书:108007本 视频:842个
    详情
样例
样例