Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.

学习

机器学习

机器学习

机器学习

Подписчиков: 0, рейтинг: 0

机器学习与数据挖掘

问题分类聚类回归异常检测数据清洗自动机器学习关联规则强化学习结构预测特征工程特征学习線上機器學習無監督學習半监督学习排序学习语法归纳
監督式學習 (分类 · 回归) 决策树集成（装袋，提升，随机森林） k-NN 线性回归朴素贝叶斯神经网络邏輯迴歸感知器支持向量机（SVM）相关向量机（RVM）
聚类 BIRCH 层次 k-平均期望最大化（EM） DBSCAN OPTICS 均值飘移
降维因素分析 CCA ICA LDA NMF PCA LASSO t-SNE
结构预测概率图模型（贝叶斯网络，CRF, HMM）
异常检测 k-NN 局部离群因子
神经网络自编码深度学习多层感知机 RNN 受限玻尔兹曼机 SOM CNN Transformer模型
强化学习 Q学习 SARSA 时序差分学习深度强化学习
理论偏差/方差困境计算学习理论经验风险最小化 PAC学习统计学习 VC理论
研讨会 NeurIPS ICML ICLR
查论编

人工智能系列内容

主要目标知识表示自动规划机器学习語言處理电脑视觉机器人学強人工智慧弱人工智慧生成式人工智慧
实现方式符号人工智能深度学习貝氏網路进化算法
人工智能哲學伦理人工智能安全幻觉存在风险图灵测试中文房间可解釋人工智慧友好的人工智能
历史时间轴发展人工智慧低谷人工智能热潮
技术应用项目编程语言
术语术语
查论编

机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点，到以“知识”为重点，再到以“学习”为重点的自然、清晰的脉络。显然，机器学习是实现人工智能的一个途径之一，即以机器学习为手段，解决人工智能中的部分问题。机器学习在近30多年已发展为一门多领域科际整合，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法（要防止錯誤累積）。很多推论问题属于非程序化決策，所以部分的机器学习研究是开发容易处理的近似算法。

机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、游戏和机器人等领域。

定义

机器学习有下面几种定义：

机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。
机器学习是对能通过经验自动改进的计算机算法的研究。
机器学习是用数据或以往的经验，以此优化计算机程序的性能标准。

電腦科學家Tom M. Mitchell在其著作的Machine Learning一書中定义的機器學習為：A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

算法

具体的机器学习算法有：

构造间隔理论分布：聚类分析和模式识别
构造条件概率：回归分析和统计分类
通过再生模型构造概率密度函数：
- 最大期望算法
- 概率图模型：包括貝氏網路和Markov随机场
- Generative Topographic Mapping
近似推断技术：
最优化：大多数以上方法，直接或者间接使用最优化算法。
量子機器學習

引用

来源

书籍

Bishop, C. M. (1995). 《模式识别神经网络》，牛津大学出版社. ISBN 0-19-853864-2.
Bishop, C. M. (2006). 《模式识别与机器学习》，Springer. ISBN 978-0-387-31073-2.
Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分类》（第2版）, New York: Wiley. ISBN 0-471-05669-3.
MacKay, D. J. C. (2003). 《信息理论、推理和学习算法》（页面存档备份，存于互联网档案馆），剑桥大学出版社. ISBN 0-521-64298-1
Mitchel.l, T. (1997). 《机器学习》, McGraw Hill. ISBN 0-07-042807-7
Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.

外部链接

UCI description （页面存档备份，存于互联网档案馆）
机器学习软件Weka （页面存档备份，存于互联网档案馆）
Pablo Castro主页（页面存档备份，存于互联网档案馆）
机器学习网邮件列表（页面存档备份，存于互联网档案馆）
机器学习和自然语言处理-弗莱堡大学（页面存档备份，存于互联网档案馆）
机器学习和数据挖掘，生物信息学小组，慕尼黑工业大学
机器学习和生物计算-Bristol大学（页面存档备份，存于互联网档案馆）
机器学习和应用统计学@微软研究
机器学习研究月刊（页面存档备份，存于互联网档案馆）
机器学习期刊（页面存档备份，存于互联网档案馆）
机器学习-Kmining，数据挖掘和KDD科学参考（页面存档备份，存于互联网档案馆）
Book "智能系统社区" by Walter Fritz
开放目录项目（页面存档备份，存于互联网档案馆）
机器学习论文-CiteSeer （页面存档备份，存于互联网档案馆）
Orange，使用Python脚本语言的机器学习组件和可视化编程接口（页面存档备份，存于互联网档案馆）

参见

人工智能
计算智能
数据挖掘
模式识别
机器学习方面重要出版物（计算机科学）
机器学习方面重要出版物（统计学）
自主控制机器人
归纳逻辑编程
决策树
神经网络
强化学习
贝叶斯学习
最近邻居法
计算学习理论
深度學習
機器學習控制

查论编主要的数学领域

历史纲要列表符号表

数学基础	范畴论集合论数理逻辑数学哲学	$Math.svg$

代数	抽象交換群论初等代數线性代数多重线性代数泛代数

数学分析	微积分实变函数复变函数微分方程泛函分析調和分析

离散数学	组合数学图论序理论博弈论

几何学	代数几何解析几何微分几何离散几何学欧几里得几何非欧几里得几何有限几何学

数论	算术代數數論解析数论几何数论算术几何丢番图几何

拓扑学	点集拓扑代数拓扑微分拓扑几何拓扑

统计学	测度与概率数理统计学数据科学统计推断迴歸分析统计学习理论机器学习人工智能数据结构与算法

计算数学	计算机科学计算理论数值分析最优化计算机代数

应用数学	控制论信息论计算化学数理生物学数理经济学计量经济学數理金融學数学心理学数学物理学生物統計學

其它	数学史娱乐数学数学与艺术数学教育

注释	数学的领域也可根据“MSC分类标准”或“中国学科分类国家标准”进行分类。

分类主题共享资源专题

统计学

描述统计学

连续概率

集中趋势	平均数（平方 · 算術 · 幾何 · 調和 · 算术-几何 · 几何-调和 · 希羅／平均数不等式） · 中位數 · 眾數

离散程度	全距 · 变异系数 · 百分位數 · 四分位距 · 四分位数 · 標準差 · 方差 · 平均差 · 標準分數 · 切比雪夫不等式 · 基尼系数

分布形态	中心极限定理 · 矩（偏態 · 峰態）

离散概率

次數 · 列聯表

推論統計學
和假說檢定

推論統計學	置信区间 · 區間估計 · 显著性差异 · 元分析 · 贝叶斯推断

实验设计	总体 · 抽樣 · 重抽样（刀切法 · 自助法 · 交叉驗證） · 重复 · 阻碍 · 靈敏度和特異度 · 區集 · 缺失数据

样本量	標準誤 · 零假设 · 备择假设 · 第一类错误与第二类错误 · 统计功效 · 效应值

常规估计	贝叶斯推断 · 區間估計 · 最大似然估计 · 最小距離估計 · 矩估计 · 最大间距

假设检验	Z檢驗 · 学生t检验 · F檢定 · 卡方检验 · Wald檢定 · 曼-惠特尼檢定 · 秩和检验

生存分析	生存函数 · 乘積極限估計量 · 對數秩和檢定 · 失效率 · 危險比例模式

相關及
迴歸分析

相关性	干擾因素 · 皮尔逊積矩相關係數 · 等級相關 (斯皮尔曼等级相关系数 · 肯德等級相關係數) · 自由度 · 误差和残差

線性回歸	線性模型 · 一般线性模型 · 廣義線性模型 · 简单线性回归 · 普通最小二乘法 · 贝叶斯回归 · 方差分析 · 协方差分析

非线性回归	非参数回归模型 · 半参数回归模型 · 邏輯迴歸

统计图形

饼图 · 条形图 · 双标图 · 箱形圖 · 管制圖 · 森林圖 · 直方图 · 分位圖 · 趋势图 · 散点图 · 莖葉圖 · 雷达图 · 示意地圖

其他

统计类型
回應過程效度
統計誤用

分类
主题
共享资源
专题

查论编计算机科学的主要领域

注：该模板大致遵循ACM 电脑分类系统。

计算机硬件	印刷电路板外部设备集成电路超大规模集成电路绿色计算電子設計自動化

系统架构组织	電腦系統架構嵌入式系统实时计算

网络	网络传输协议路由网络拓扑网络服务

软件组织	直譯器中间件虛擬機器操作系统软件质量

软件符号和工具	编程范型编程语言編譯器领域特定语言軟體框架集成开发环境软件配置管理函式庫

软件开发	软件开发过程需求分析软件设计软件部署軟體維護开源模式

计算理论	自动机可计算性理论計算複雜性理論量子计算数值计算方法计算机逻辑形式语义学

算法	算法分析算法设计算法效率随机化算法计算几何

计算数学	离散数学信息与计算科学统计学数学软件数理逻辑集合论数论图论类型论范畴论信息论数值分析数学分析

信息系统	数据库管理系统電腦數據企业信息系统社会性软件地理信息系统决策支持系统过程控制数据挖掘數位圖書館系统平台數位行銷万维网信息檢索

安全	密码学形式化方法入侵检测系统网络安全信息安全

人机交互	计算机辅助功能用户界面可穿戴计算机普适计算虚拟现实聊天機器人

并发性	并发计算并行计算分布式计算多线程多元處理

人工智能	自动推理计算语言学计算机视觉进化计算专家系统自然语言处理机器人学

机器学习	監督式學習無監督學習强化学习交叉驗證

计算机图形学	计算机动画可视化渲染修飾照片圖形處理器混合现实虚拟现实图像处理图像压缩实体造型

应用计算	电子商务企业级软件计算数学计算物理学计算化学计算生物学計算社會科學医学信息学数字艺术電子出版網絡戰电子游戏文字处理器運籌學教育技术学生物信息学认知科学文件管理系统

分类主题专题维基共享

查论编机器学习同数据挖掘主題

基本概念	学习 · 運算學習論

數學模型	迴歸模型 · 人工神经网络（深度学习） · 決策樹 · 貝氏網路 · 支持向量机 · 关联规则学习

學習範式	监督学习 · 無監督學習 · 强化学习 · 遺傳演算法

主要應用	统计分类 · 表征学习 · 降维 · 聚类分析 · 异常检测

相關領域	计算科學 · 人工智能 · 统计学 · 數據科學 · 计算机科学 · 信息与计算科学 · 神经科学 · 认知科学

可微分计算

概论

可微分编程
神经图灵机
可微分神经计算机
自動微分
神经形态工程
模式识别

概念

梯度下降
电缆理论
聚类分析
迴歸分析
- 過適
对抗机器学习
运算学习理论
注意力机制
卷积
損失函數
反向传播算法
激活函数
正则化
資料集

编程语言

Python
Julia

应用

机器学习
人工神经网络
- 深度学习
科学计算
人工智能
深伪技术
语言模型
- 大语言模型

硬件

TPU
VPU
憶阻器
SpiNNaker

软件库

TensorFlow
PyTorch
Keras
Theano
JAX

实现

视觉	AlexNet 人體圖像合成 HWR OCR 人脸识别系统 DALL-E Stable_Diffusion

音频	WaveNet 语音合成语音识别

自然语言	Word2vec Transformer BERT LaMDA NMT 辩论者项目沃森 GPT-2 GPT-3 GPT-J ChatGPT GPT-4

决策	AlphaGo Q学习 SARSA OpenAI Five 自動駕駛汽車 MuZero

科学计算	AlphaFold AlphaTensor

人物

艾力克斯·格雷夫斯
伊恩·古德费洛
约书亚·本希奥
杰弗里·辛顿
杨立昆
吴恩达
杰米斯·哈萨比斯
大衛·席爾瓦
李飛飛

机构

Anthropic
DeepMind
EleutherAI
Google Brain
Meta AI
Mila
MIT CSAIL
OpenAI

主题
- 计算机编程
- 技术
分类
- 人工神经网络
- 机器学习

机器学习

定义

分类

算法

引用

来源

外部链接

参见