记录IT学习资源、教程和个人作品展示。
按文章、学习笔记和作品案例分区整理,方便检索、回看和持续积累。
- 教程整理
- 学习笔记
- 项目实践
记录IT学习资源、教程和个人作品展示。
按文章、学习笔记和作品案例分区整理,方便检索、回看和持续积累。
适合阅读更成体系的内容整理和专题复盘。
最新文章 给AI模型添加记忆 2025.07.08 进入文章分区更偏过程性,方便按时间线回顾学习进度。
最近笔记 葡萄酒数据分类实战:Logistic Regression、SVM 与决策树对比 2026.05.23 进入学习笔记集中查看做过的东西、实现方式和结果呈现。
最新项目 视频脚本一键生成器 2025.07.06 进入作品案例Latest Dispatch
保留时间流,但用更易扫读的首页网格呈现最近发布的文章、笔记和作品。
本文基于scikit-learn自带的公开葡萄酒数据集,完整演示特征标准化、Pipeline串联预处理与模型、5折交叉验证的全流程,对比逻辑回归、RBF核SVM、决策树三类经典分类器的性能差异,给出可复现代码、结果解读与模型选择的实践建议。
本文基于小规模离散特征分类数据集,先通过sklearn建立决策树基线,再手写实现节点分裂的核心逻辑,对照验证信息熵与基尼系数两种划分准则的行为一致性,从底层理解决策树的生长原理。

以手写数字分类任务为例,对比逻辑回归与 SVM 在使用和不使用 PCA 降维时的效果,并结合 LangGraph 构建能够自动规划、执行和汇总机器学习建模任务的智能体工作流。

本文基于汽车购买属性数据,比较 KMeans、DBSCAN 与 Agglomerative Clustering 三种聚类方法,并引入 LLM 作为参数空间生成器,在保证评分与最终裁决完全由确定性代码执行的前提下,讨论无监督学习调参、聚类评价失真和工程化流程设计。

本文基于一份汽车购买相关离散特征数据,使用 KMeans、DBSCAN 与分层聚类三种无监督学习方法进行对比实验,分析不同聚类算法在类别编码数据上的表现差异,并讨论轮廓系数、簇结构稳定性与特征表示方式对结果的影响。

本文基于 LFW 人脸数据集,在统一的 StandardScaler + PCA 预处理条件下,对 Logistic Regression 与 Linear SVM 进行公平比较,并使用 Nested Cross Validation 避免调参与评估耦合,综合分析两类模型在泛化性能、稳定性与训练成本上的差异。

基于天池工业蒸汽量预测任务,对比 SVR、Lasso、ElasticNet 等回归模型表现,并通过加权平均融合与权重搜索进一步提升预测效果。

从数据读取、标准化、逻辑斯蒂回归建模到混淆矩阵、错误样本分析、Softmax 概率推导与 GridSearchCV 调参,系统完成手写数字 0~9 多分类实战。

从平均法、加权平均法到 Stacking,系统梳理机器学习中的模型融合思路,并结合 Bagging 平均融合给出完整实战流程。

本文介绍了如何使用LangGraph构建一个简单的Hello World图。