博客 & 札记
- 《第七天》 — 《第七天》更像是人死以后,还没能真正离开这个世界,只能回头看一眼,看见活着的时候那些没被认真对待的人和事。
- 我尝试了一下一个人去旅行 — 那是一种没有想象中的孤独和远超想象的活力体验
- 3d重建ios原生 — Rebuilder3D 是一个基于 iOS 原生能力开发的 3D 扫描 App,用于通过 iPhone 连续拍摄真实物体,并在手机本机完成 3D 重建、USDZ 模型生成、模型预览和分享。项目不依赖服务器,不上传用户图片,适合用于离线物体扫描、AR 模型预览、移动端 3D 建模原型
- 关于AI Coding的现状 — Codex Agent 生态爆发:RAG、Skill、Agent 曾是 AI Coding 的核心,如今却逐渐被更强的大模型原生能力重新定义。
- 《给阿嬷的情书》 — 一封又一封来自下南洋的爱人的信,殊不知爱人早已逝去50多年。
- 《增广贤文》
- 《宗萨仁波切真言》
- 经验主义
- 写在前面的话
- 梦想中的生活
- 基于python+html的桂林跑牌 — 基于python做的web端桂林跑牌
- OpenAI Image2 — 厉害的成图
- Codex 的 Computer Use — Computer Use 出现后,Codex 的边界开始往外走:它不只看代码,也能看屏幕;不只告诉你该点哪里,也能在授权范围里点击、输入、滚动、检查页面变化。
- Google Stitch — AI取代UI设计师已初见端倪
- 《我的妈耶》
- 专业陪coding
- 《挽救计划》
- 斯人已逝,逝者如斯夫
- 隐贤山庄过大年
- 日常剪指甲
- 《我的蔚蓝色时刻表》
- 我的世界模组——王国战争
- 《时间从来不语,却回答了所有问题》
- 聊一聊python3.14 — Python 3.14 带来的变化很有意思:它不是只加一点语法糖,而是在“字符串处理、类型注解、并发模型”三条线上同时推进。`t-string` 让模板字符串变成可处理的结构化对象,注解延迟让类型系统更舒服,多解释器则把“同进程里的隔离并行”摆到了标准库台面上。
- 聊一聊GPT5 — GPT-5,不能只把它看成“回答更聪明的聊天框”。更准确的说法是:GPT-5 代表了一类更会推理、更会调用工具、更适合长流程任务的模型家族。
- 《我们终将孤独的长大》 — 孤独为翼,向阳生长
- 我的世界模组——附魔扩展
- 《世界需要更好的你》 — 我们总在追逐一个“更好”的自己,却常常在迷茫中追问:何为更好?为何要成为更好的自己?
- 网络安全——App逆向防护 — App防逆向不是追求“永远无法分析”,而是把核心逻辑拆散、隐藏、校验、下沉,让攻击者拿到安装包后也很难直接复刻业务链路。比较实用的思路是:Java 层负责业务编排,混淆后降低可读性;Native 层承载关键计算,配合加密封装和完整性校验提高提取成本;服务端再做风控闭环,避免客户端单点失守。
- 《分手清单》
- 秘钥存储器 — 个人使用的数据存储器,主要存储账号密码之类的数据。服务器部分功能暂时剔除。
- 《拆掉思维里的墙》 — 拆墙破茧,解锁人生的无限可能
- 网络安全——逆向工程 — 先把边界讲清楚:这篇只面向自有 App、授权审计、兼容性排查、恶意样本研究和安全学习。不讨论越权分析、商业保护规避、账号滥用、接口攻击,也不提供绕开线上校验的做法。
- 《人间失格》 — 于沉沦的废墟上,看见孤独者的灵魂悲鸣
- 我的世界模组——新型武器 — 继强化模组后发布的第二套模组
- 《天堂旅行团》
- 网络安全——Python与web防护 — Web 安全里有一组概念经常一起出现:`Cookie`、`Token`、`IP 检测`、`指纹检测`、`DDoS 防护`。 它们看起来分散,其实都在解决同一个问题:服务端怎么判断“这个请求是不是可信、是不是异常、是不是该继续处理”。
- 《罗生门》 — 在人性的迷雾里,看见善恶交织的真相
- 网络安全——Python与密码学 — 密码学听起来很硬,但写业务代码时遇到的场景往往很朴素:生成登录 token、保存用户密码、给配置文件加密、校验下载包有没有被改、给接口消息签名。
- 聊一聊DeepSeek-R1 — DeepSeek-R1 让推理模型火起来,不只是因为它会做数学题、会写代码、会给出更长的分析。更关键的是,它把“模型会不会思考过程”这件事从少数顶级闭源系统里拉到了更大的讨论场。
- 《小鱼干是我的,你也是我的》 — 爱猫人士的专属之作
- MCP:让 AI 从“会聊天”走向“会接入生活” — Model Context Protocol,简称 MCP,可以先别把它想得太技术。它更像一套给 AI 准备的标准插座:模型本身会理解和生成内容,但要真正帮你处理文件、查资料、改数据、调用工具,就需要一个可靠的连接方式。
- 《胜券在握》
- 我的世界模组——强化模组 — 上个月发布1.21.3 java版的我的世界,趁着休息做个强化模组
- 《梦笔生花》
- 《逆行人生》
- 聊一聊sora — 文生视频真正破圈,不是因为多了一个很酷的按钮,而是因为“拍视频”这件事开始从专业流程里松动出来。
- 《厚黑学》
- Stable Diffusion V3 — Stable Diffusion 3 是 Stability AI 推出的文本生成图像模型系列。 它和早期 Stable Diffusion 系列最大的区别,不只是“图像质量更好”,而是底层生成框架发生了明显变化:核心从传统 U-Net 思路转向 Multimodal Diffusion Transformer,也……
- 《时光不老,我们不散》
- 《城市微旅行》
- 《理想国》
- 聊一聊GPT-4o — GPT-4o 里的 `o` 来自 omni,意思是“全能式的、多模态的”。这句话听起来挺大,但放到普通人的使用里,它最直接的变化其实很朴素:你不一定非要把所有需求都写成一段完美文字,也可以丢一张图、给一段材料、发一份乱糟糟的草稿,让它帮你看懂、整理、改写、推演。
- 《热辣滚烫》
- Real-ESRGAN进行图像修复 — Real-ESRGAN 是一个面向真实场景图像修复和超分辨率的开源项目。 它的常见使用方式是:给一张图片或一个目录,输出放大和修复后的结果。
- 《华山论贱》
- 专业”陪玩“
- Real-ESRGAN进行 — Segment Anything Model,通常简称 SAM,是一类“可提示分割”模型。它不是传统意义上只会识别固定类别的分割网络,而是接收点、框、粗略 mask 等提示,然后返回目标区域的候选遮罩。
- 《李清照词传》 — 千古第一才女的双面人生
- 《前任4》
- 《极简静心法》 — 当代内耗星人的速效静心手册
- python-telegram-bot自动化社交机器人 — 这是个好东西- -
- 《八角笼中》
- 《消失的她》
- 《道德经》 — 解锁老子的“反内耗生存指南”
- Fabric.js自定义组件 — Fabric.js 本身给了很多基础对象:`Rect`、`Circle`、`Textbox`、`Image`、`Group`。但业务里常见的不是“画一个矩形”这么简单,而是“拖一个商品卡片”“放一个头像徽章”“编辑一个流程节点”“把组件保存成 JSON 下次还能恢复”。
- 《发现宇宙——discovering the universe》 — 一本科普类图书,对于天文爱好者适用- -
- Gradio——用Python快速搭出 AI 应用界面 — 做模型或数据工具时,最容易卡住的地方经常不是算法本身,而是“怎么让别人顺手试一下”。 如果为了一个模型 demo 还要写前端、写接口、调样式、部署页面,节奏很容易被打断。
- 《桃花流水在人世》 — 解锁陆小曼的“烟火与诗意双面人生”
- Stable Diffusion — Stable Diffusion 最迷人的地方,不是“输入一句话就出图”这么简单,而是它把文本理解、潜空间降噪、图像解码、风格控制这些东西拼成了一条很可操作的生产线。你可以写 prompt,也可以改图、补图、固定构图、批量生成,甚至把它包装成自己的图像服务。
- 《深夜饭票》 — 这本书的惊喜,便是你打开它的一瞬间
- Elasticsearch python版 — Elasticsearch 很容易被一句“能搜得很快”概括掉,但真正落到业务里,它更像一套检索工作台:字段怎么建、词怎么切、查询怎么拼、结果怎么排、Python 怎么把数据送进去,每一步都会影响最后的体验。
- 《你是人间四月天》 — 被林徽因的温柔狠狠治愈
- 板鸭趴
- 《小窗幽记》 — 解锁古人的“闲雅生存指南”
- Rabbitmq从崩溃到放弃 — 重试拓扑、异步消费者与生产治理
- 三亚走起
- 《人生大事》
- 《你在忙什么》 — 解锁当代人“反内耗”的正确姿势
- Rabbitmq从入门到崩溃 — `RabbitMQ + Python pika` 这条线,把消息模型、路由方式、可靠消费和常见实战写法串起来。 目标不是只把示例跑通,而是让你真正知道:消息到底是怎么走的,哪里最容易翻车
- 《法治的细节》 — 于细节处见正义,于温情中懂法治
- 《复活》 — 从“摆烂少爷”到“救赎者”,看人性的逆风翻盘
- MongoDB索引与复合索引 — MongoDB 索引不是“字段慢了就建一个”的按钮。业务复杂以后,真正难的是判断一条查询到底长什么样:哪些字段是等值过滤,哪些字段要排序,哪些字段是范围筛选,是否要分页,是否要覆盖查询,是否在分片集群里通过 `mongos` 路由。
- Mongo一些神奇的玩法 — 上一篇讲的是 MongoDB 和 PyMongo 的日常主线:文档模型、CRUD、普通索引、聚合、事务、批量写入、分页和连接管理。这篇换一条更偏工程深水区的路线:Change Streams、Schema Validation、GridFS、读写关注、读偏好、命令监听、Raw BSON、Decimal128 和一些线上……
- 《了凡四训》 — 原来命运是本可编辑的剧本
- 我是钢琴家!
- 《你好李焕英》
- mongo——python上手,天下我有 — 使用docker安装MongoDB,以及一些简单的使用pymongo去连接和操作mongodb的实战代码
- Matplotlib绘图进阶 — 很多人用 `matplotlib`,停留在“能画图”这一层:`plot` 一下、`bar` 一下、`savefig` 一下,任务就算结束。 但一旦你开始做报告图、科研图、监控面板、批量导图,或者需要把风格、布局、导出过程统一起来,`matplotlib` 的真正价值才会慢慢露出来。
- 《雄狮少年》
- Nginx流量网关 — 请求怎么选虚拟主机,`location` 怎么命中,`proxy_pass` 后面那个斜杠会不会改 URI,upstream 怎么复用连接,缓存怎么防击穿,限流怎么放在正确位置,日志字段怎么才能定位后端问题
- OpenCV——特征匹配、标定、光流和 DNN — “工程深水区”的 OpenCV-Python:特征点匹配、单应性矩阵、相机标定、镜头去畸变、光流跟踪、DNN 推理和性能排查。
- 亚特兰蒂斯+蜈支洲岛
- 回家咯
- OpenCV-Python——从读图到轮廓检测的实战路线 — OpenCV-Python 的入口很轻:`import cv2`,读一张图,转个颜色,做个滤波,找个边缘,画个框。它不像深度学习框架那样一上来就要训练模型,而是更像一把图像处理工具刀,适合快速把图片和视频帧加工成你想要的形态。
- FFmpeg——从命令到工作流 — 你可能只是想干一件很朴素的事: - 把视频转成 `mp4` - 抽一张封面图 - 把音频单独导出来 - 裁一段片头 - 给视频压一压体积
- 携这个总那个总那个总去旅游
- 我是钢琴家
- Azkaban——轻量级任务调度工具 — Azkaban 是 LinkedIn 开源的一套批处理工作流调度系统。它的核心思路很朴素:把一组任务按依赖关系组织成 flow,上传成项目包,然后由 Azkaban 负责触发、执行、查看日志、处理失败和管理权限。
- ClickHouse——分析函数 — 开窗函数在clickhouse的用法
- 回家回家
- ClickHouse——常规函数 — ClickHouse 的函数非常多。真正写分析 SQL 的时候,最常撞上的不是高深算法,而是这些普通函数:类型转换、字符串清洗、JSON 提取、数组处理、条件分支、NULL 兜底。
- ClickHouse——Data Types
- 《刺杀小说家》
- 给奶奶过生日
- ClickHouse——MergeTree — ClickHouse 好用,很大一部分是因为 `MergeTree` 系列表引擎够能打。它负责列式存储、高吞吐写入、后台合并、分区裁剪、稀疏主键索引、数据跳读索引,也撑起了很多生产分析场景。
- 《送你一朵小红花》
- 字体压缩解决方案 — 前端项目里,图片越来越省,脚本越来越会拆,结果一看资源包,最大的家伙居然是字体文件,这事一点都不稀奇。尤其是中文字体,一旦整包塞进项目,体积很容易就上天。你明明只用了几百个字,最后却把整套字库一起拖进来了,网络层看了都想叹气。
- 日常搞饭
- 戴上它,一百码没感觉
- 三亚团建冲冲冲
- Protobuf:把接口数据结构写成一份硬协议 — 很多接口一开始用 JSON 很爽:字段随便加,调试也直观。可当系统变大,服务变多,语言栈变杂,问题就冒出来了:字段名改了谁知道?类型变了谁兜底?移动端、后端、数据任务是不是都按同一份结构理解?
- atxserver 技术博客 — 一聊 Android 自动化,很多人脑子里先冒出来的是 `uiautomator2`。但如果设备不止一台、使用者不止一个、还想把接入、占用、释放、安装这些动作都管起来,只靠一个客户端库就有点撑不住了
- Vue3深水区:响应式边界、渲染函数和数据流实战 — 上一篇如果算“把 Vue 3 项目写顺”,这一篇就往更难的地方钻一点:大型状态怎么控、外部对象怎么接、动态页面怎么渲、组件怎么统一释放副作用、SSR怎么避坑、WebSocket数据流怎么接进页面。
- 长隆动物园
- uiautomator2——用 Python 把 Android 自动化跑起来 — 做 Android 自动化,很多人第一反应是 Appium。Appium 能力完整,但启动链路偏重。uiautomator2 的路线更轻:Python 脚本直接连设备,点按钮、输文本、看元素、截图、拉日志,写起来很像在遥控一台手机。
- 我是钢琴家- -
- Fastapi——Dependency、SwagUI、自定义状态码 — `FastAPI` 让人上头的地方,不只是它快,而是很多平时写接口时容易散掉的东西,它都帮你收得很利落。比如: - 公共逻辑不想每个路由都手写一遍 - 返回状态码不想总是糊成一个 `200`
- 通通带走
- Fastapi——GET、POST、图片视频请求 — GET 查询、POST JSON、图片上传、视频上传、图片返回、视频播放,再补一点 Python 客户端请求示例
- Frida Hook Android — 把动态插桩、方法观测和 Python 驱动串起来。如果你是在调试自己的 Android 应用,或者想做一套更灵活的动态观测方案,`Frida` 非常适合干这类活:
- 第一次见北京下这么大的雪
- mitmproxy技术博客 — 抓包工具很多,mitmproxy 的气质比较特别:它既能像传统代理一样看请求响应,又能用 Python 写脚本,把“看一眼”升级成“自动处理一批”。
- 我是钢琴家
- BERT 技术博客:从双向上下文到微调落地 — 它最有意思的地方,不只是把 `Transformer Encoder` 用在了自然语言处理上,而是把“先做大规模预训练,再拿去做下游任务微调”这件事,做成了大家都能复用的标准套路。于是文本分类、问答、命名实体识别、句子匹配这些任务,突然不需要每次都从头练一个模型了。
- 三维视图看懂 `keras.permute_dimensions` 和 `numpy.transpose`
- 词句相似度计算:余弦相似度和 TF-IDF — 两句话到底像不像,机器没法像人一样先“感觉一下”。比较常见的做法是:先把文本变成向量,再比较两个向量的方向。 余弦相似度做的就是这件事。它不太关心向量有多长,更关心两个向量是不是朝着差不多的方向走。方向越接近,相似度越高。
- 清华的秋天
- 马克西姆来北京了!
- FRCNN 和 YOLOv3 损失函数详解 — 有些目标检测文章一讲到 `loss` 就开始一串公式劈头盖脸砸下来,看着像懂了,回头一写代码又有点发懵。这个话题其实没必要绕那么远: - 真实标签到底长什么样 - 网络最后吐出了什么 - 这些量分别在逼着模型优化什么
- 欢迎空军 giegie来访
- 深度学习里的可分离卷积:把大卷积拆成轻快两步 — 普通卷积很好用,但也很“费”。输入通道多、输出通道多、卷积核又不小的时候,计算量和参数量都会蹭蹭上去。 可分离卷积的思路很妙:既然普通卷积同时做了“空间特征提取”和“通道混合”,那我们能不能把这两件事拆开?先在每个通道里单独看空间,再用 `1×1` 卷积把通道信息混起来。
- 云南旅游
- GAN 与 CycleGAN — 聊生成对抗网络时,很多人一开始会被各种图绕晕。明明只想搞懂一句话,结果一眼望过去全是 `G`、`D`、真假标签、双向箭头、回环路径,脑子直接开始打结。
- 层层逼近,搞懂 Norm 系列到底在解决什么 — 深度学习里的 Norm 家族很热闹:BN、LN、IN、GN、SN,看名字像一串缩写暗号。 但它们的出发点并不玄乎:网络越深,中间层的数据分布越容易乱跑。分布一乱,后面的层就要一边学习任务,一边适应前面层不断变化的输出,训练自然会变慢、变抖,甚至变得难收敛。
- 卷积神经网络新姿势:除了余弦卷积,这几招也值得认真看一眼 — 上一篇我们已经聊过 `CosineConv2D` 这种更偏卷积算子层面的新玩法,这一篇换个方向,看几个不用大改骨架、但很有意思的“小招式”。
- CosineConv2D:用余弦相似度重新理解卷积 — 普通卷积大家都熟:卷积核在图像上滑动,每次取一个局部窗口,和卷积核做对应位置相乘再求和。 `CosineConv2D` 换了一个思路:不要只看点乘结果有多大,而是看输入局部窗口和卷积核方向有多像。
- YOLOv3 整体归纳总结 — 如果前面几篇已经把 `YOLOv3` 的网络结构、数据输入、损失函数分别拆过一遍,那么最后这一篇就很适合做个收口:它到底好在哪,坑又埋在哪。
- 疫情啊疫情啊
- YOLOv3 损失函数详解:xy、wh、置信度和类别 — YOLOv3 的损失函数看起来绕,主要是因为它不是只算一个分类误差,而是同时处理四件事:框中心点是否准 、框宽高是否准 、这个位置是否有目标 、目标属于哪个类别
- YOLOv3 数据输入详解 — YOLOv3 的模型结构很重要,但训练能不能跑起来,第一关往往不是网络,而是数据。 图片怎么读?标注怎么写?框坐标怎么变?anchor 怎么匹配?`y_true` 到底是什么形状?
- YOLOv3网络结构 — YOLOv3 的 backbone 是 `Darknet-53`。这个名字很好记,因为它主要由 `53` 个卷积层构成。
- 深入理解 Embedding 层的本质:不只是降维 — 很多人第一次接触 Embedding 时,会把它理解成“把 one-hot 降维”。这个理解没错,但只说了一半。Embedding 更重要的能力是:把离散对象放进一个连续向量空间,让模型能够学习它们之间的关系。
- 旅个小游
- BN、LN、IN:它们到底在“归一化”什么 — 归一化层做的事情,本质上就是先把一组值拉回到更稳定的分布附近,再交给可学习参数重新调整。
- 一文看懂 CNN 反向传播原理 — CNN,也就是卷积神经网络,前向传播比较容易理解:输入图像经过卷积、激活、池化、全连接,最后得到预测结果。
- Logistic Regression 原理探讨:从概率、Logit 到 Python 实战 — Logistic Regression,中文通常叫逻辑回归。名字里带“回归”,但它最常见的用途其实是分类,尤其是二分类。
- CNN 里全局池化和全连接层怎么理解:原理、区别与 Python 用法 — 为什么有的模型最后接的是全连接层?为什么有的模型会直接用全局平均池化?全局池化能不能替代全连接层?
- 深度学习里的 Embedding 层:从 one-hot 到稠密向量 — Embedding 是深度学习里非常常见的一层,尤其是在自然语言处理、推荐系统、搜索、广告、用户画像这些场景里,几乎到处都能看到它。
- 卷积神经网络里的 BN、Dropout 和 Leaky ReLU:原理与 Python 用法 — 卷积神经网络听起来很硬核,但很多常见组件其实都在解决很朴素的问题:让网络更好训练、让梯度更稳定、让模型别太容易记住训练集。
- 决策树的常见玩法 — 决策树是一种非常直观的机器学习模型。它的思路很像人在做判断:先问一个问题,根据答案走到不同分支,再继续问下一个问题,最后得到一个预测结果。
- sparksql的常见用法 — Spark SQL 是 Spark 体系里最常用的一层能力。 很多团队用 Spark 做数据处理,并不直接写大量 RDD 代码,而是更多使用SQL的方式
- CrossEntropy-->>交叉熵 — 交叉熵是机器学习里最常见的损失函数之一,只要你接触过分类模型,几乎一定会遇到它。
- 《一出好戏》
- spark rdd快速上手 — RDD,全称 Resilient Distributed Dataset,是 Spark 中最基础的分布式数据抽象。虽然现在很多项目更常用 DataFrame 和 Dataset,但理解 RDD 仍然很有价值。
- spark安装与部署 — Apache Spark 是大数据领域里最常见的分布式计算框架之一。 很多人第一次接触 Spark,最先卡住的不是算子,也不是作业提交,而是安装过程:
- sql的插入、更新、合并插入更新的常用操作和常见问题 — 写 SQL Server 的时候,`SELECT` 往往是最容易上手的,真正容易写出事故的反而是 `INSERT`、`UPDATE` 和 `MERGE INTO`
- sql的四大分析函数 — 在 SQL Server 里,窗口函数是处理“分组内排序、排名、分页、Top N、分桶分析”最顺手的工具之一。其中最常用的 4 个排名相关函数是: ROW_NUMBER() RANK() DENSE_RANK() NTILE()
- redis技术分享——(2) — Redis Sentinel 是 Redis 官方提供的高可用方案。它主要用于监控 Redis 主从集群,并在主节点故障时自动完成故障转移,把某个从节点提升为新的主节点。
- redis技术分享——(1) — 很多人刚开始使用 Redis 时,只把它当作简单的 `key-value` 缓存。实际上,Redis 真正强大的地方在于它提供了多种数据结构。不同的数据结构适合不同的业务场景,选对结构往往比单纯记住命令更重要。
- 我毕业了!