Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础、ML算法简介、DL算法简介)来理解技术交互流程
目录
2、数据结构与算法——查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历
3、编程学习基础——编程语言/工具/环境、容器/函数/常用库
1、基于处理问题进行算法分类——分类问题、回归问题、聚类问题、推荐系统、模型融合常用的算法
1、Tensorflow基本应用(安装、基本概念、基本函数、执行流程、Keras、实现回归算法)
剖析自己
1、个人能力角度
确定自己应具备的能力:以结果为导向的思维,看职位要求让做什么,自己会会什么,还差哪些?
职位条件 |
目前能力 |
还差的能力 |
ML算法工程师 |
熟悉python/R、SQL等语言。 精通任何一种面向对象编程语言,如python,c/c++或java; |
熟悉hadoop生态圈的常用工具(如spark,pig等); |
DL算法工程师 |
具有较强编程能力,熟练使用至少一种脚本语言(python/shell等),有C++开发经验, |
熟悉linux开发环境,有MPI、CUDA经验更佳; |
至少精通一种开源框架Tensorflow、Caffe、MxNet、Theano、Torch; 有Deep Learning实战经验,熟悉常用框架,有多机多卡分布式集群开发部署经验者优先; |
||
CV算法工程师 |
具有较强编程能力,熟练使用至少一种脚本语言(python/shell等),有C++和java开发经验。 精通C/C++,有良好的编程规范; |
熟悉linux开发环境。 |
熟悉caffe、 pytorch,、tensorflow经验更佳; 有丰富的图像处理经验,熟练掌握opencv等库的使用; |
||
有图像检测、数字信号处理、统计机器学习、深度学习项目经验者优先; 有扎实的数学基础和较深厚的图像处理经验; |
熟悉物体(人体、人脸、通用目标)检测、跟踪与识别的基本算法; 对模式识别、图像处理以及计算机视觉有较深入的理解,熟悉人脸检测/跟踪/识别、OCR、物体和场景识别、多目标跟踪、人体关键点检测等相关算法 |
|
NLP算法工程师 |
||
对文本算法(分类,聚类,语义分析,概率模型,相似度等)有深入的理解和应用经验。 |
||
有过文本反垃圾实践经验优先,有深度学习实践经验优先。 |
||
广告算法工程师 |
熟悉Python编程语言 熟练使用 Python / Java / C++(中的一项或多项)做开发 |
熟悉Linux开发环境 |
Tensorflow 等深度学习框架。 |
||
有大数据上的特征工程或模型开发(LR/FM/GBDT/DNN 不限) 经验 |
||
熟悉Hadoop/Spark/Storm等大规模分布式计算系统; 能够熟练使用 Spark 或 Hive SQL 进行数据处理, |
2、选择公司角度
条件 |
选择标准 |
期望 |
年薪 |
||
兴趣 |
||
发展方向 |
||
职业规划 |
一、AI基础
1、数学基础——高等数学、概率统计、线性代数
T1、微积分、统计学/概率论、线性代数
微积分
- 求导
- 梯度
- 偏微分
- 积分
统计学/概率论
- 推断统计学和概率论的基本概念
- 高斯分布
- 贝叶斯公式
- 最小二乘法
- 线性回归
- 逻辑回归
线性代数
- 向量
- 向量空间
- 向量投影
- 矩阵运算
- 特征值分解
- SVD分解
T2、数据分析、概率论、线性代数及矩阵、凸优化
1.数据分析 | a. 常数e b. 导数 c. 梯度 d. Taylor e. gini系数 f. 信息熵与组合数 g. 梯度下降 h. 牛顿法 |
2.概率论 | a. 微积分与逼近论 b. 极限、微分、积分基本概念 c. 利用逼近的思想理解微分,利用积分的方式理解概率 d. 概率论基础 e. 古典模型 f. 常见概率分布 g. 大数定理和中心极限定理 h. 协方差(矩阵)和相关系数 i. 最大似然估计和最大后验估计 |
3.线性代数及矩阵 | a. 线性空间及线性变换 b. 矩阵的基本概念 c. 状态转移矩阵 d. 特征向量 e. 矩阵的相关乘法 f. 矩阵的QR分解 g. 对称矩阵、正交矩阵、正定矩阵 h. 矩阵的SVD分解 i. 矩阵的求导 j. 矩阵映射/投影 |
4. 凸优化 | a. 凸优化基本概念 b. 凸集 c. 凸函数 d. 凸优化问题标准形式 e. 凸优化之Lagerange对偶化 f. 凸优化之牛顿法、梯度下降法求解 |
2、数据结构与算法——查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历
查找、哈希、表达式、字符串、堆与栈、排序、高级算法、链表、数组、动态规划、遍历
3、编程学习基础——编程语言/工具/环境、容器/函数/常用库
T1、编程语言/工具/环境
编程语言:python/Java/C语言/C++
大数据相关:Hadoop/Spark
数据挖掘:Pandas、Numpy、scipy、Matplotlib
数据分析:R
交互式环境:ipython notebook
T2、容器/函数/常用库
1. 容器 | a. 列表:list b. 元组:tuple c. 字典: dict d. 数组: Array e. 切片 f. 列表推导式 g. 浅拷贝和深拷贝 |
2. 函数 | a. lambda表达式 b. 递归函数及尾递归优化 c. 常用内置函数/高阶函数 d. 项目案例:约瑟夫环问题 |
3. 常用库 | a. 时间库 b. 并发库 c. 科学计算库 d. Matplotlib可视化绘图库 e. 锁和线程 f. 多线程编程 |
二、ML算法简介
1、基于处理问题进行算法分类——分类问题、回归问题、聚类问题、推荐系统、模型融合常用的算法
处理分类问题常用算法 |
逻辑回归(工业界常用)、支持向量机、随机森林、朴素贝叶斯(NLP中常用)、深度神经网络(视频、图片、语音等多媒体数据中使用)、决策树 |
处理回归问题常用算法 |
线性回归、普通最小二乘回归逐步回归、多元自适应回归样条 |
处理聚类问题常用算法 |
K均值、基于密度聚类、LDA |
推荐系统的常用算法 |
协同过滤算法、FM |
模型融合和提升的算法 |
Bagging、Adaboost、GBDT、GBRT、Stacking、Blending |
2、机器学习概述
特征工程、回归算法、决策树、随机森林和提升算法、SVM、聚类算法、EM算法、贝叶斯算法、隐马尔科夫模型、LDA主题模型
1、特征工程
a. 特征抽取
b. 特征转换
c. 特征选择
d. 降维
f. NLP特征工程
2、回归算法
a. Linear Regression算法
b. Lasso Regression算法
c. Ridge Regression/Classifier算法
d. Elastic Net算法
e. Logistic算法
f. K-邻近算法(KNN)
3、决策树、随机森林和提升算法
a. 决策树算法: ID3、C4.5、CART
b. 决策树优化
c. Bagging和Boosting算法
d. 随机森林
e. Adaboost算法
f. GBDT算法
g. XGBoost
h. LightGBM
4、SVM
a. 线性可分支持向量机
b. 核函数理解
c. SMO算法
d. SVM回归SVR和分类SVC
5、聚类算法
a. 各种相似度度量介绍及相关关系
b. K-means算法
c. K-means算法优缺点及变种算法
d. 密度聚类
e. 层级聚类
f. 谱聚类
6、EM算法
a. 最大似然估计
b. EM算法原理讲解
c. 多元高斯分布的EM实现
d. 主题模型pLSA及EM算法
7、贝叶斯算法
a. 朴素贝叶斯
b. 条件概率表达形式
c. 贝叶斯网络的表达形式
8、隐马尔科夫模型
a. 概率计算问题
b. 前向/后向算法
c. HMM的参数学习
d. 高斯混合模型HMM
9、LDA主题模型
a. LDA主题模型概述
b. 共轭先验分布
c. Dirichlet分布
d. Laplace平滑
e. Gibbs采样详解
f. LDA与word2Vec效果比较
三、DL算法简介
1、Tensorflow基本应用(安装、基本概念、基本函数、执行流程、Keras、实现回归算法)
- Tensorflow安装
- Tensorflow基本概念
- Tensorflow基本函数
- Tensorflow执行流程
- Tensorflow之上的工具库:Keras
- 项目案例:基于Tensorflow实现回归算法
2、深度学习概述—BP、RBF、CNN、RNN、GAN等
深度学习是实现机器学习的技术,同时深度学习也带来了机器学习的许多实际应用,拓展了AI的使用领域,本阶段主要从TensorFlow、深度学习概述、感知器神经网络、BP神经网络、RBF径向基神经网络、CNN卷积神经网络、RNN循环神经网、等方面讲解深度学习相关算法以及深度学习框架的使用。
- 感知器神经网络
- BP神经网络
- RBF径向基神经网络
- 卷积神经网络(CNN)
- 循环神经网络(RNN)
- 生成对抗网络(GAN、WGAN、EBGAN、DCGAN等)
原文链接:https://blog.csdn.net/qq_41185868/article/details/87474311?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171851498716800197052943%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=171851498716800197052943&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-14-87474311-null-null.nonecase&utm_term=AI%E9%9D%A2%E8%AF%95