时歌
All Posts

全部文章

模型考古学(一):大模型原理探赜

这篇博客探讨了大模型(如GPT系列)背后的神经网络基础,从神经网络的基本结构、反向传播算法、梯度下降法,到Transformer架构及其在大语言模型中的应用。文章详细解析了大模型的训练过程、参数优化以及如何通过海量数据提升模型性能。最后,回顾了大语言模型架构的发展历程,比较了不同模型(如BERT和GPT)的特点和应用场景。

7798 字|39 分钟

使用 Qwen VL 系列模型实现图片分类和OCR任务

2025-01-10深度学习未标签

阿里云的通义千问(Qwen)大模型在2024年末大幅降价,尤其是Qwen-VL系列模型,为开发者提供了低成本的多模态视觉-语言处理能力。通过零样本学习,开发者无需训练即可实现图片分类和OCR任务,极大提升了工作效率。本文详细介绍了如何利用Qwen-VL进行图片分类和笔记归档整理,展示了其强大的性能和易用性。

4118 字|21 分钟

Trading101:策略交易解析

策略交易通过数学模型、历史数据分析和计算机程序,构建系统化交易策略,力求在市场波动中获利。其优势在于纪律性、高效性和风险可控性,帮助投资者克服情绪化操作。本文介绍了现货/合约网格、马丁格尔、智能套利、定投和信号策略等工具,分析了其原理、实施方法和潜在风险,为投资者提供了策略交易的入门指南。

5412 字|27 分钟

国行Xbox series X/S账户转港区教程

2024-12-29技术教程未标签

本文详细介绍了如何将国行Xbox Series X/S主机转换为港区的完整步骤,包括U盘格式化、创建特殊文件和系统设置修改等操作,帮助玩家解锁更多游戏内容和XGP服务。

1094 字|5 分钟

简析经济学与金融学实证中的几个常用简单模型

2024-12-03金融与经济未标签

引言 经济学和金融学作为社会科学的重要分支,其研究目的在于理解和预测经济主体的行为以及金融市场的运作规律,二者研究范围很大一部分都重叠于分析复杂经济体系中各种行为主体的决策及其相互作用机制。实证研究作为连接理论与现实的桥梁,通过对数据的收集、整理和分析来检验经济理论的有效性,并为政策制定和投资决策提

7859 字|39 分钟

从最近的恶性事件看类《看门狗》中CtOS犯罪评估系统的可能性

2024-11-19随笔未标签

声明:相关性不等于因果性 首先,必须要在本文开头声明的是,近期大众观念里的“恶性事件频发”可能并不能代表社会整体治安的恶化,更不能将犯罪现象治安问题和所谓的经济下行导致戾气严重相关联。我知道这种因果关系简单直接符合人类思维逻辑,在传播上也容易刺激到人们的爽点,但我在实际查证经济周期和犯罪案件数量之后

9321 字|47 分钟

从碎片到系统:我的信息整理与优化之路

2024-11-11随笔未标签

我的管理方案和存在的问题 在信息爆炸的时代,我们每个人的知识源都被碎片化地分布在不同的平台和工具中。从公众号文章到书籍摘录,从研究报告到PDF文件,广领域、多平台、全天候的各种信源交错与堆积,每天都有大量的信息需要管理和处理。 作为一个知识工作者,我处理信息的软件一共有四个:Cubox用来集中处理解

2331 字|12 分钟

不再依赖平台:如何打造自己专属的博客网站?

2024-11-06技术教程未标签

序 这两天我在读居伊·德波的《景观社会》,在网络社会崛起与“媒体过剩”的时代,借助于日益发达的大众传媒工具,景观的作用与功能也日益强化。从轻松的娱乐废料到严肃文学,从日常生活到人的感情和欲望,我们的生活几乎每一个角落都被景观所笼罩和取代,景观的无孔不入让每个个体仿佛置身于一场永不停歇的表演之中。 在

2801 字|14 分钟