弥勒佛

让天下没有难做的大数据模型！

现有的机器学习框架/软件包存在几个问题：

弥勒佛项目的诞生就是为了解决上面的问题，在框架设计上满足了下面几个需求：

安装/更新

go get -u github.com/huichen/mlf

下面是弥勒佛框架解决的问题类型，括号中的斜体代表尚未实现以及预计实现的时间

监督式学习：最大熵分类模型（max entropy classifier），决策树模型（decision tree based models，2014 Q1）
非监督式学习：聚类问题（k-means，2014 Q1）
在线学习：在线梯度递降模型（online stochastic gradient descent）
神经网络（2014 Q2/3）

项目实现了下面的组件

多种数据集（in-mem，skip）
多种评价器（precision，recall，f-score，accuracy，confusion）和交叉评价（cross-validation）
多种优化器：协程并发L-BFGS，梯度递降（batch, mini-batch, stochastic），带退火的学习率（learning rate），L1/L2正则化（regularization）
稀疏向量（sparse vector）以存储和表达上亿级别的特征
特征辞典（feature dictionary）在特征名和特征ID之间自动翻译