28 GitHub上最流行的开源机器学习项目

< > >
作者:机器人网络MP
现在,
机器学习已逐渐成为行业的热点,经过二十多年的发展,当前机器学习领域得到了广泛的应用,如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、DNA测序、语音和手写识别、战略游戏和机器人等。
> >强> 1。tensorflow <H2>
< > >

TensorFlow是第二代机器学习系统由谷歌发行。据谷歌称,在一些基准,TensorFlow的处理速度比第一代快2倍distbelief。

具体来说,TensorFlow是一个数据流图的使用(数据流图)的开源软件库的数值计算:图中的节点(节点)代表的数学运算,并在图的边缘(边缘)的多维数组之间的相互流通节点表示,即张量(张量)。这种灵活的架构允许用户部署一个或多个CPU的台式机,服务器或移动设备将被计算在不同,不需要重写代码;同时任何基于梯度的机器学习算法可以得出tensorflow足够的自动分化(自动分化);此外,通过Python接口柔性。思想的tensorflow表达变得更简单。

TensorFlow最初是由谷歌集团开发的大脑研究人员和工程师(属于谷歌的机器智能研究所)。其目的是进行机器学习和深层神经网络的研究。但该系统的通用性足以使其广泛应用于其他计算领域。
目前,谷歌已广泛应用于谷歌,包括人工智能技术,包括谷歌应用程序的语音识别、Gmail的自动恢复功能、谷歌照片的图像搜索等。

开发语言:C++


许可协议:Apache许可证2

GitHub项目地址:GitHub。COM / tensorflow /…
> >强> 2。scikit学习<H2>

scikit学习是一种机器学习的Python模块,它是建立在SciPy。该项目是由David Cournapeau在2007创建的,当项目被命名为谷歌代码之夏,从那时起,许多志愿者都促成了这。
其主要特点是: >
操作简单、高效的数据挖掘和数据分析。
没有任何访问限制,在任何情况下都可以重用

基于NumPy、SciPy,matplotlib,


学习
scikit基本功能主要分为六个部分:分类、回归、聚类、数据降维、模型选择、数据的预处理,可以参考官方网站上的文件。经过测试,可以运行在2.6 scikit学习Python,Python 2.7和Python 3.5。此外,它还应该可以在Python 3.3和Python 3.4上使用。

注意:scikit学习被称为scikits学习之前。
开发语言:python

许可协议:3-clause BSD许可


GitHub项目地址:GitHub。COM / scikit李尔…
> >强> 3。咖啡<H2>

咖啡是一种表达,速度产生了深深的学习框架,在神经网络的模块化。后来,正是通过伯克利的视野和学习中心的贡献发达(BVLC)和社区参与,形成宽松自由的社会占主导地位的伯克利,再加上GitHub和咖啡用户邮件。

咖啡是一个基于C++ / CUDA架构。开发人员可以使用它自由组织网络。目前,支持卷积神经网络和全连接神经网络(人工神经网络)。在Linux中,C++可以操作界面通过命令行,也有MATLAB和Python专用接口,和操作支持的CPU和GPU直接无缝切换。

咖啡的特点:


易于使用:在文本的形式而不是代码是Caffe的模型以及相应的优化。咖啡给出模型的定义、优化设置和培训前的重量,所以它可以快速方便地。
快速:能运行最佳模型和海量数据;

咖啡可结合使用cudnn可用来测试alexnet模型,和处理图片对K40只需要1.17ms;


模块化:易于扩展到新的任务和设置;

用户可以通过提供的咖啡层类型定义自己的模型;


当前Caffe应用实践主要包括数据整理、设计网络结构、训练结果,基于现有的培训模式,并利用咖啡直接识别。

开发语言:C++


许可协议:BSD了2-clause许可


GitHub项目地址:github.com/bvlc

资料全部来自网络,如果有问题可以发邮件到站长邮箱