人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

人工智能(NLP)常用算法总结(面试准备)

2024-06-30 53

一、人工智能学习算法分类

人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)

总的来说,在sklearn中机器学习算法大概的分类如下:

(1).回归算法
(2).分类算法
(3).聚类算法
(4)降维算法
(5)概率图模型算法
(6)文本挖掘算法
(7)优化算法
(8)深度学习算法

(1).模型优化
(2).数据预处理

二、详细算法

(1).LR (Logistic Regression,逻辑回归又叫逻辑分类)
(2).SVM (Support Vector Machine,支持向量机)
(3).NB (Naive Bayes,朴素贝叶斯)
(4).DT (Decision Tree,决策树)
(5).KNN (k-Nearest Neighbors,K近邻算法)

  • 1).C4.5
  • 2).ID3
  • 3).CART

(5).集成算法

  • 1).Bagging
  • 2).Random Forest (随机森林)
  • 3).GB(梯度提升,Gradient boosting)
  • 4).GBDT (Gradient Boosting Decision Tree)
  • 5).AdaBoost
  • 6).Xgboost

(6).最大熵模型

(1).LR (Linear Regression,线性回归)
(2).SVR (支持向量机回归)
(3). RR (Ridge Regression,岭回归,L2正则化)
(4). Lasso Regression,L1正则化

(1).Kmeans 算法([优缺点与改进](https://blog.csdn.net/u014465639/article/details/71342072))
(2).层次聚类
(3).密度聚类
(4).网格聚类
(5).模型聚类 GMM

(1).PCA 主成分分析
(2).LDA 线性判别分析
(3).降噪自编码器
(4).t-SNE(降维后可视化效果好)

(1).贝叶斯网络
(2).HMM
(3).CRF (条件随机场)

(1).模型

  • 1).LDA (主题生成模型,Latent Dirichlet Allocation)
  • 2).最大熵模型(其实是个多分类模型,归这里不一定合适)

(2).关键词提取

  • 1).tf-idf
  • 2).bm25
  • 3).textrank
  • 4).pagerank
  • 5).左右熵 :左右熵高的作为关键词
  • 6).[互信息](https://blog.csdn.net/BigData_Mining/article/details/81279612)

(3).词法分析

  • 1).分词
    – ①HMM (因马尔科夫)
    – ②CRF (条件随机场)
  • 2).词性标注
  • 3).命名实体识别

(4).句法分析

  • 1).句法结构分析
  • 2).依存句法分析

(5).文本向量化

  • 1).tf-idf
  • 2).word2vec
  • 3).doc2vec
  • 4).[cw2vec](https://www.jianshu.com/p/f258d0c5c317)

(6).距离计算

  • 1).欧氏距离
  • 2).相似度计算

原文链接:https://blog.csdn.net/zhoucheng301/article/details/90736736?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171851498816800227478200%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=171851498816800227478200&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-15-90736736-null-null.nonecase&utm_term=AI%E9%9D%A2%E8%AF%95

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部