请选择语言

中国开源年度报告

中国开源年度报告

中国开源的开发者调查、生态环境报告、深度专题分析

开源社组织了《2018 开源年度报告》调查,从多种纬度、多种方式、多种协作来尝试描绘中国开源生态体系的现状

一、调查之问卷篇

中国开源参与调查报告

本次调查问卷以开源社区协作的方式共同完成,以草根的方式自底向上完成。根据问卷调查搜集结果,对数据进行清理, 交叉比对之后,以数据,图表的形式客观的呈现给大家,同时邀请了开源社区里的专家对结果进行点评,分析和预测。

二、以数据事实来呈现

指南针篇

指南针项目就是为了让开发人员在寻找开源项目方便、快速、准确找到合适的项目,如同在一大片开源的大海中有一个指南针指引前行。

指南针的三个阶段:

  • 第一阶段:针对项目对应其中的内容做数据分析,项目的静态数据都成为可以搜寻和推荐的依据和显示的内容;
  • 第二阶段:以项目和贡献者的连接的图像呈现方式,让使用者更直观的发现项目和项目之间的关系,也可以透过项目和人的关系对整个开源社区进行了解。
  • 第三阶段:对项目的代码本身做更深度的分析。

调查方法论:

  • 使用网络爬虫与 API 获取开源代码库的数据如原代码、项目信息
  • 将项目的静态信息如项目名称、起始日期等与动态信息如项目下载次数、客户喜爱程度等储存在数据结构
  • 处理原始数据与结构化的单元,生成如分类、统计、排序、标签等总和数据。
  • 使用机器学习、人工智能自然语言处理、数据分析等技术,综合所有数据提供如分类、搜索、推荐、评比等应用服务。

Grank 篇

Grank 是另外一种以 GitHub 数据为基础,按照设定方法进行采集、聚类、分析的开源软件评估的开源项目。它提供了观察源于中国的或以中国贡献者为主的开源项目发展的的另外一种数据视角。Grank 不仅可以用于综合评估一个开源项目的活跃度、社区化程度,也可以由此反射出开源项目背后的企业、组织在开源方面的实质性投入程度。

三、洞察篇

通过开源社的开源专家委员会、开源专家、业内观察者的多年累积,再根据今年的动向,为大家呈现具有业内先进洞见的分析报告。