Cool Creations

GPT4

当一个名为“Quasar Alpha”的神秘模型跳入现场时，我公开宣布这很可能是 OpenAI 最新的旗舰模型。虽然我错误地称它为“GPT-5”，但我 100% 正确，这确实是 OpenAI 的最新模型。

前不久，“GPT-4.1”正式发布，这些模型的有效性令人发指。然而，没有讨论的是它对各地数据分析师的现实影响。

GPT-4.1 系列是 OpenAI API 中提供的三个新模型：GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

这些模型几乎在所有方面都优于 GPT-4o 和 GPT-4o mini，尤其是在编码和指令跟随方面。它们还具有更大的上下文窗口 — 支持多达 100 万个token —并且实际上能够使用整个窗口。

然而，对于任何新模型，我不一定相信它们的创造者对他们性能的评价。我喜欢亲自测试它们。

2024 年，OpenAI 系列模型被认为是最好的。这种情况在 2025 年发生了翻天覆地的变化。

随着所有这些版本的发布，GPT-4 失去了“最佳 AI 模型”的称号。该头衔属于 Anthropic（凭借 Claude 3.7 Sonnet 的原始功能）和 Google（凭借 Gemini Flash 2.0 的成本效益）。

为了测试这些模型的有效性，我在一项复杂的推理任务中对每个大型语言模型进行了测试，该任务的重点是用于财务分析的 SQL 查询生成。这项任务涉及向每个模型询问 60 个财务问题，并让模型生成能够正确回答这些问题的 SQL 查询。

GPT-4.1 的成功率最高，为 93.3%，平均分最高，为 0.884，以微弱优势超过双子座 2.5 Pro 的 92.5% 成功率和 0.880 的平均分。

特别有趣的是性价比平衡。虽然 GPT-4.1 以高价位（每百万token 2.00 美元输入/8.00 美元输出）提供最佳原始性能，但它与 Gemini 2.5 Pro（1.25 美元/10.00 美元）的价格段相似。

将此与以前的“世界上最好的模型”（Claude 3.7 Sonnet）相比，Google 和 OpenAI 毫不费力地赢得了这个奖项。它们在成本、速度和原始性能方面更好。

Filed under: 未分类

产品经理面试一般要经历这5类问题的考察：

1、自我介绍

主要考察总结表达，更多在于让双方都进入最佳沟通状态。这个部分可以重点提炼：做过什么项目，取得什么效果，控制在1分钟以内。

2、考察项目内容真实性&产品基本功（重点）

一般会问简历提及的产品/功能，参与的深度怎么样，是负责某一个环节，还是多个环节，对应开发周期多久。

eg：当时为什么要做xx功能？是怎么做的？执行过程中碰到了什么问题吗？针对xx功能你还有哪些优化思考？

3、考察逻辑分析和产品思维能力（重点）

不少同学的简历，都会写：做了xx功能，提升了xx指标。

这个环节，面试官会经常追问「为什么」，以此来考验候选人的逻辑分析和产品思维，答案没有标准唯一。

eg：针对该类项目数据，面试官会追问“为什么xx功能能提升指标？是否会引起其他指标下跌？是基于哪些分析，得出要做xx功能的”。

4、考察业务理解深度（重点）

这类属于比较开放的问题，主要考察候选人的行业认知和业务理解

eg：你觉得你们的产品和竞品最大的差异点是什么？你怎么看待现在很火的AIxx功能？

5、反问环节

由候选人向面试官提出问题。如果提出的问题与公司业务相关，说明更有诚意，意向度会更高。

以上问题，你会从什么层面进行回答？你会多深入去聊？

很多产品经理由于简历包装、产品认知/经验不足、面试准备不足等原因，在面试的时候会出现脑袋一片空白答不出来或是回答跑偏的情况，导致面试频频失败！

Filed under: 未分类