引言

本文是对线性代数核心知识的笔记整理与扩展,因为笔者最近正在学习Gilbert Strang教授的Linear Algebra and Learning from Data(中文译名:线性代数与数据学习)一书,该书的第一章着重介绍了对应用线性代数的相关知识,该章节中从多个不同矩阵分解的视角来引领读者看待线性代数的本质核心。

本系列将记录笔者在学习线代知识的同时利用Python这一工具将数学理论转化为代码实践。

- 阅读剩余部分 -

引言:

科学可视化本质上是数据到图形的映射工程。Matplotlib作为Python生态的核心可视化工具,其设计哲学融合了:

  • 分层抽象体系(Backend -> Figure -> Axes -> Artist)
  • 声明式与命令式混合编程范式
  • 基于对象的图形描述系统

本教程将从底层原理出发,逐步构建进阶的可视化能力。

- 阅读剩余部分 -

引言

向量数据库,顾名思义,它是用来存储向量的数据库。它是一种专门用于存储和管理高维向量数据的数据库,能够高效地进行相似性检索。与传统数据库不同,它侧重于处理复杂、非结构化的数据,如文本、图像、音频等。

事实上向量数据库并不是崭新的领域,在过去,它与近似最近邻搜索(ANNS)算法被广泛应用于推荐系统上,在人脸识别、图像搜寻等领域已经存在有比较长的时间,只是近年来随着LLM的普及,向量数据库也开始走红。

- 阅读剩余部分 -

引言

随着AI多模态大模型的迅速迭代,并伴随着技术市场普及推广,越来越多的科技巨头都推出了自家的AI品牌,由最开始OpenAI的ChatGPT的突然出现,到如今深度求索公司的开源大模型DeepSeek的快速崛起,AI产品层出不穷,我们都相信未来的时代必定是AI的时代。笔者可以常在短视频平台上刷到相关的案例:AI+医疗、AI+法律、……,仿佛一切一切只要是有关于人们对于信息提取的工作,我们都可以通过引入AI工具帮助快速且精准地提效。近期,笔者所在的公司也在部署AI平台应用,理所当然地,Dify这一应用走进了我的视野。

- 阅读剩余部分 -