haebom
Sign In
数据分析中细微的差异也能带来巨大的成果
Haebom
Nov 1, 2023
2y ago
最近多亏了LLM,数据分析的学习变得更简单、更有趣了。在这个过程中,我也注意到了可重复性的问题,并找到了相关文章,特此分享。
科学研究中可重复性的问题由来已久。可重复性指的是不同研究者重复同样实验时能否得到相同结果的能力。
可重复性的问题
•
对统计显著性的误解:研究者们往往只依赖“统计显著性”来解读结果。这其实只是对复杂问题的一种简单化处理。
•
研究方法的选择:分析方法不同,结果往往差别很大。例如,某些研究者可能不会考虑特定变量。
案例
青铜色鸟的成长与兄弟间竞争
研究背景
青铜色鸟的成长受多个因素影响,其中之一就是兄弟间的竞争。
本研究分析了兄弟间竞争对青铜色鸟成长和存活率的影响。
分析方法
统计分析:研究者们使用了多种统计方法分析数据。
变量选择:研究者们考虑了父母鸟年龄、兄弟数量、食物量等多种变量。
结果与解读
研究者A认为兄弟间竞争对成长有积极影响。
而研究者B则解读为这种竞争对成长有负面影响。
结果证明,这些差异正是由分析方法和变量选择所致。
桉树种子的萌发及草地影响
研究背景
桉树种子的发芽受多种环境因素影响。
本研究重点分析了草地的存在对桉树种子发芽的影响。
分析方法
实验设计:研究者们在有草和无草两种环境下分别进行了桉树种子的发芽实验。
数据收集:收集了发芽率、生长速度、成活率等多个指标。
结果与解读
分析认为,草地的存在会降低桉树种子的发芽率。
但也发现,根据分析方法和实验条件不同,结果可能会有极大差异。
结果解读与对策
•
整体来看,几种分析结果加在一起具有一定的意义。但根据分析方法不同,结果差异依然明显。
•
科学研究的不确定性:这些多样的结果说明了科学研究本身的不可确定性。
因此,可以通过以下方式加以克服。
•
多种分析方法的应用:在同一项研究中结合多种分析方式,可以提升结果的可靠性。
•
明确说明分析依赖:研究论文中应指出所选用的分析方法及其对结果的影响。
Two questions, hundreds of scientists, no easy answers: how small differences in data analysis make huge differences in results
246 scientists looked at the same data sets and drew very different conclusions.
theconversation.com
Subscribe to 'haebom'
📚 欢迎来到 Haebom 的档案馆。
---
我发布与 IT 💻、经济💰 和人文🎭相关的文章。
如果您对我的想法、观点或兴趣感兴趣,请订阅。
haebom@kakao.com
Subscribe