mlSourceNote - juedaiyuer/researchNote GitHub Wiki
逐步完善中...
##数学##
- 偏差与方差
- 拉格朗日
- 核函数
- 凸优化
- 协方差矩阵
- Hessian矩阵
- CDF(累计分布函数)
- 高斯概率密度函数
- 中心极限定理
##机器学习##
1.处理小数据效果好 2.深度学习---大数据,超过500w;图像,语言方面效果奇好
- SVD
- 最小二乘法
- 梯度下降法
- 局部加权回归
- 牛顿法
- 高斯判别分析
- EM
- 隐马尔可夫模型
- 决策树向量机
- K近邻
- 支持向量机
- PageRank
- 强化学习
- LDA
- PCA
- pLSA
- LSI
- ICA
- 最大熵模型
- 条件随机场
- 最大熵隐马尔可夫模型
- Gradient Boosting
- K-Means
- 贝叶斯逻辑斯蒂克回归
- 关联规则挖掘
- 随机森林
##信息论
- 压缩率很高的数据结构
- 信息熵与信息增益
- 数据压缩原理
- 香农游戏
- 二维码原理
##深度学习
- 各种编程语言的深度学习库整理
- 深度学习如何入门(知乎)
- Elephas:Apache Spark上的Keras深度学习框架
- Google开源新一代深度学习系统TensorFlow
- TensorFlow
- 感知器
- 反向传播算法
- 自动编码器
- 栈式自编码器
- 微调多层自编码算法
- 深度信息网络
- softmax回归
- 白化
- 池化
- 受限玻尔兹曼机
- 稀疏编码
- 递归神经网络
- 卷积神经网络---图像识别,语音识别,,.
- 前馈神经网络
##全文检索
- 搜索建索引过程
- 搜索评分过程
- 搜索查询分析器
- Rocchio相关反馈算法
- 向量空间模型
- BM25基于概率的搜索评分
- Lucene源码分析
- solrcloud
- Solr空间搜索原理
- GeoHash算法
- 地理空间距离计算原理
- WAND检索算法
- 智能化信息检索模型
- Kullback-Leibler距离/相关熵
- 交叉熵
##计算广告##
- 正文广告
- 上下文广告
- 显示广告
- 合约广告
- 竞价广告
- 搜索广告
- 受众定向
- 竞价广告的定价机制
- eCPM估计
- 广义第二高价
- 精准人群定向
- 实时竞价
- 广告交易平台
- 需求方平台(DSP)程序购买
- 广告有效性原理
- 二部图匹配算法
- HWM算法
- 点击流挖掘
- 广告系统的一些商业模式
- 实时反作弊
- CTR点击预测
- 架构
##自然语言处理##
- N-gram语言模型
- 词共现/TFIDF
- 噪声信道模型
- 统计分类模型
- 语义相关性
- 基于HMM的词性标注
- 统计语言模型的评价方法
- 扩充转移网络
- 动态规划算法
- 最小编辑距离
- 浅层句法分析技术
- 知识库的构建
- 命名实体识别
- 未登陆词识别
- 语言模型结构设计
- 树邻近语法
- 文本建模
- 随机上下文无关文法
- 概率上下文文法
- 同义词自动构建(词共现,基于浅层语法分析)
- 文本分类技术
##架构
- OOP
- 聊天系统/实时高效信息系统架构与源码
- Bloom Filter 过滤器
- 分布式时钟(逻辑时钟) 同步技术
- SCALA
- Netty
- Jetty
- 一致性Hash
- 分布式基本组建
- 原子广播
##爬虫##
- 爬虫原理
- 分布式架构
- 通用爬虫
- 主题爬虫
- Nutch
- Xpath
- 网页去重
- URL去重
##应用##
- 人脸识别
- 垃圾邮件分类
- 文本聚类
- 语音合成(分解)
- 语音识别
- 手写识别
- 推荐系统
- 文档主题分析
- 二进制权限系统
- 搜索引擎关键字智能提示
- 最小敏感局部hash算法
- Simrank
- 手写输入法
- 为文本生成关键词和摘要
- 拼音缩写提取
- 汉字转拼音/拼音转汉字
- 机器翻译
- 自动提取标签
- 图片提取标题
- 文字生成图像
- 问答系统 ...
##Github中的开源项目##
- 值得mark的11个开源机器学习项目
- scikit-learnGithub------一种基于 NumPy、SciPy和matplotlib的用于数据挖掘和数据分析的工具
- Shogun---Github---Shogun(中文版)
- Accord Framework/AForge.net---Github
- Mahout
- MLlib
- H2O---Github
- Cloudera Oryx
- GoLearn
- Weka
- CUDA-convnet
- ConvNetJS---Github
- TensorFlow
- Theano更加高效地定义、优化和评估涉及多维数组的数学表达式
- caffe一个由伯克利视觉与学习中心(BVLC)和社区贡献者开发的深度学习框架,它兼具表现力和速度,还有模块化的优点
##个人收集网址##
- Microsoft Research
- 机器学习温和指南
- 从零实现来理解机器学习算法:书籍推荐及障碍的克服
- 伯乐在线---机器学习
- Coursera
- 台湾机器学习课程
- 机器学习之开源库大总结
- 推荐!国外程序员整理的机器学习资源大全
- 机器学习经典书籍
- 机器学习经典论文/survey合集
- 人工智能和机器学习领域有哪些有趣的开源项目
- 机器学习该怎么入门(知乎回答)
- 整理:深度学习 vs 机器学习 vs 模式识别
- DataRefiner
- Github上有哪些有趣的关于NLP或者DL的项目
- 25个Java机器学习工具&库
- 49 Machine Learning Resources and Related Articles from Top Bloggers
##微信公众号##
- 机器之心
- 新智元
##机器学习需要了解的人物##
###中国大牛组###
- 周志华---个人主页
- 杨强---个人主页
- 李建中---分布式数据库
- 唐杰---个人主页-图挖掘
- 张钹
- 刘铁岩---个人主页
- 王海峰---个人主页-信息检索,NPL,机器翻译
- 何晓飞---个人主页-多媒体处理,图像检索,流型学习
- 朱军
- 吴军---个人主页
- 张栋---个人主页
- 戴文渊---个人主页
- 李航---华为诺亚方舟实验室
《中国大牛组》资源来源于小木虫
###世界大牛组###
大拿们都有其链接(LinkedIn/Twitter)
- 李飞飞---ImageNet
- 李佳
- Jeff Dean
- Geoffrey Hinton---个人主页
- Yann Lecun---个人主页---Yann Lecun
- Yoshua Bengio---个人主页---MILA
- Jurgen Schmidhuber---个人主页
- Alex “Sandy” Pentland---个人主页
- Peter Norvig---个人主页
- Corinna Cortes---个人主页
- Micheal I Jordan---个人主页
- Andrew Ng---个人主页
- Daphne Koller---个人主页
- Hilary Mason---个人主页---LinkedIn
- Sebastian Thrun---个人主页
- Jeff Hammerbacher---个人主页
- Jeremy Achin---个人主页---kaggle
- Carla Gentry---个人主页---LinkedIn
- DJ Patil
- Adam Coates
- Monica Rogati
- Oliver Grisel
- Owen Zhang
- Sergey Yurgenson
- Stanislav Semenov
- Gilberto Titericz Jr.
- Kirk Borne
- Doug Cutting
- karpathy---Github---李飞飞高徒
- DemisHassabis---Deepmind
- David Silver---Deepmind
- Piotr Dollar---个人主页---Facebook人工智能研究室
- 田渊栋---Facebook人工智能研究室---知乎
- 贾扬清---Caffe作者---Facebook---知乎
##web##
##会议##
ML两大顶会
顶级计算机视觉会议
##论文收集##
##书籍
- PRML---Pattern Recognition And Machine Learning豆瓣
##competition##