データ分析
speakerdeck.com ここ最近で一番好きなデータ分析の資料だが、Data-Informedという言葉は寡聞にして知らなかった。 いわゆる、データに基づいた意思決定(Data-informed decision-making、DIDM)というやつだ。 何か新しいものを作ろうという時、今までは自…
www.businessinsider.jp 記事も面白いが、 売れ筋はおかずの入ったお弁当。お弁当を始めてから店頭で迷う人が減り、回転率が良くなったという。 というのがデータアナリストの末席にいる人間にはとても気になる。 店頭でお客さんが迷っている時間、というの…
よくスポーツジムというのはオジリナル水を売っている。まあ変哲もない水を安く売っているか、特殊な水だと謳って高く売っているかどちらかだろう。 安い水を売っているところに、倍ぐらいの値段で付加価値の高い水を売ったとしよう。 それは売れるのか? そ…
WITH句のことをCTEと呼ぶ?そこでも再帰が使える仕様があるのを初めて知りました。 BigQueryでも使えるみたいです。 www.sqlservertutorial.net WITH cte_numbers(n, weekday) AS ( SELECT 0, DATENAME(DW, 0) UNION ALL SELECT n + 1, DATENAME(DW, n + 1) …
一元配置分散分析では、3群以上の標本平均の差を検定するが、その際の帰無仮説は平均の差なんて無かったわ、という こういう形。 一元配置分散分析は英語では One-way ANOVA と呼ぶ。英語名を見て、なるほど!この帰無仮説の形が one-way じゃん、と腹落ちし…
Fitbitのデータからそんなことを言っている記事を見かけたが、 ・日中アクティブだからこそ、長時間の睡眠を必要とする ・長時間の睡眠を取ったからこそ、日中アクティブでいられる 相関関係はあっても因果は良く分からないよね。 個人的には運動をしていな…
アンケートで正確な値を取るのが難しいという話。 「あなたは身長何センチですか?」というアンケートを取ると、実測値よりも高くなる。 私も169cmぐらいだが、やはり面倒くさいので「170センチです」ということはあっても、低く見積もることはない(笑) 特…
面白かった。 medium.com There were running jokes that QAs/Devs who found an issues with the data should be tagged as data scientists. データに関する問題を発見したQAはデータサイエンティストとタグ付けするべきじゃないかというジョークもあった。…
アンケートを取る、と一口に言っても、なかなか難しいものだ。 統計学的な側面でも難しさはもちろん、アンケートを取る相手が正直に答えてくれるか、という問題がある。 聞いた話でなるほどと思うものがあったので紹介したい。 下記のアンケートを取るとする…