在上学期的网课的学习中,我参加了本校的数据分析实战课程,作为计算机学院的一名大一新生,这是我第一次接触数据分析相关内容项目。下面让我们来看看这次的预测小项目吧。 问题描述 在这次的预测中,我们需要通过134个人的年龄、性别和15938个基因的表达值来推算给出147个人性别和相同的15938个基因的表达值的年龄。 其中给我们的数据一共是三个文件,也提供给大家下载交流学习: liver_R...
一晃又两个月没有更新了,终于我们不放假大学也放假了,车牌也考完了,博客也可以开始正常更新了。在上学期末,我完成了一些有意思的小工程,下面我就为大家分享我的工程,以供交流学习。 实验要求 项目背景 校园卡管理系统是应用于校园卡管系统和应用的软件,该软件在程序设计中有它不可取代的地位, 校园卡给广大师生的衣食住行带来了极大的便利。 而在这门程序设计课程中,希望同学们为校园卡功能管理系统设计一...
在这一篇BLOG我想向你介绍一种机器学习的应用实例或者说是机器学习在一种叫照片OCR技术中的应用历史,我想介绍这部分内容的原因主要有以下三个:第一我想向你展示一个复杂的机器学习系统是如何被构建起来的;第二我想介绍一下机器学习流水线(machine learning pipeline)的有关概念;最后我也想通过介绍照片OCR问题的机会来告诉你机器学习的诸多有意思的想法和理念。 照片OCR问...
在这篇BLOG中,我们将继续聚焦大数据机器学习,看看在线学习和并行计算这两种全新的优化手段。 在线学习 在这一部分我们将会一起学习一种新的大规模的机器学习机制叫做在线学习。这种在线学习机制让我们可以模型化问题在拥有连续一波数据或连续的数据流涌进来时从中学习模型。 现如今许多大型网站或者许多大型网络公司都在使用不同版本的在线学习机制算法从大批的涌入又离开网站的用户身上进行学习。特别要提及的...
在接下来的两篇BLOG里,我们会一起探讨大规模的机器学习的相关问题。所谓大规模机器学习就是用来处理大数据的算法,如果我们看近5到10年的机器学习的历史,你会发现现在的学习算法比5年前的好很多其中的重要原因之一就是我们现在拥有很多可以训练算法的数据。所以巧妙地运用大量数据可以让我们的算法事半功倍。 大规模机器学习 为什么我们喜欢用大的数据集呢? 我们已经知道得到一个高效的机器学习系统的最好...