Causal Impact Analysis(์ธ๊ณผ ํจ๊ณผ ๋ถ์)
{CausalImpact}๋ ๊ตฌ๊ธ ๋ณธ์ฌ์์ ๋ง๋ ์๊ณ์ด ์์ธก ๋ชจํ ๊ด๋ จ R ํจํค์ง๋ก Baysian structural time-series model์ ๊ธฐ๋ฐ์ผ๋กํ๋ฉฐ, ํน์ ์ฌ๊ฑด์ด ๋ฏธ์น ์ํฅ์ ๋ํด ํ์ธํ ์ ์๋ค๋ ์ฅ์ ์ด ์๋ค. ๋ง์ผํ ๋ถ์ ๊ด๋ จํด์ ๊ณต๋ถํ๋ค๊ฐ ์๊ฒ๋ ๋ฐฉ๋ฒ๋ก ์ธ๋ฐ, ๋ง์ผํ ์ชฝ์์๋ ์ฃผ๋ก ๊ด๊ณ ๋ก ์ธํ ๊ณ ์ ํ ํจ๊ณผ๋ฅผ ์ธก์ ํ๊ฑฐ๋ ํน์ ๊ทธ ํจ๊ณผ๋ฅผ ๋ฐฐ์ ํ๊ณ ์ธก์ ํ๊ณ ์ ํ ๋ ์ฃผ๋ก ํ์ฉ๋๋ค. ์๋ฅผ ๋ค์ด์ ๋ด ๋ธ๋ก๊ทธ ํฌ์คํ 1์ ๋ฐฉ๋ฌธ์์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ํฌ์คํ 2์ ๊ด๊ณ ๋ฅผ ํตํด SNS๋ ์น์ฌ์ดํธ์ ํ๋ณดํ์ ๋์ ๋ฐฉ๋ฌธ์์๋ฅผ ์์ธกํ ์ ์๋ค๋ ์ด๋ก ์ด๋ค. (๋ธ๋ก๊ทธ์์ ์ฐพ์๋ดค์ ๋์๋ ์ฃผ๋ก GA(Google Adsence)๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์์ ์์ ์ ๋ธ๋ก๊ทธ ํธ๋ํฝ์ ํ์ฉํด ์งํํ๋ ๋ฏ ํ๋ค.)
โถ R์์ ์คํํ๋ฉด 3๊ฐ์ plot์ด ๋ํ๋๋ค.
1) original : (์ ) ๊ด๊ณ ํจ๊ณผ๊ฐ ๋ฐ์๋ ๊ฒฐ๊ณผ์น, (์ ์ ) ๊ด๊ณ ํจ๊ณผ๋ฅผ ๋ฐฐ์ ํ์ ๋ ์์๋๋ ์ถ์ ์น
2) pointwise : ๊ด๊ณ ๋ก ์ธํ ํจ๊ณผ(original์์ ๋ํ๋๋ ๊ฒฐ๊ณผ์น-์ถ์ ์น)
3) cumulative : ๊ด๊ณ ํจ๊ณผ์ ๋์ ์์น
โถ ๋ชจํ์ (Bayesian structural time-serires models)
Zt๋ d-dimensional output, Tt๋ dํ d์ด์ transition matrix, Rt๋ dํ q์ด์ control matrix
εt๋ (0,σt^2) ๋ฅผ ๋ฐ๋ฅด๋ ์ ๊ท๋ถํฌ, ηt๋ (0,Qt)๋ฅผ ๋ฐ๋ฅด๋ ์ ๊ท๋ถํฌ๋ก ๊ฐ์ด ํ์ฑ๋๋ค.
์ด์ ์์ฐจ์ ๊ฐ์ ํตํด ๋ค์์์ฐจ๋ฅผ ์์ธกํ๋ ํ์์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค.
๊ณ์ ํจ๊ณผ๋ฅผ 7days๋ก ๋ฃ์ ๊ฒ์ธ์ง(์ฃผ๋ณ), 52weeks๋ก ๋ฃ์ ๊ฒ์ธ์ง(์ฐ๋ณ)๋ฅผ ๋ํ๋ด๋ ์๋ ์์ผ๋ ๋์ค์ ๋ ํ์ธํด๋ด์ผ๊ฒ ๋ค.
ํ์ฉ ๋ฐฉ์ ๋ฐ ์ถ๊ฐ์ ์ธ ์๊ฒฌ
์ต๊ทผ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๋ง์ผํ ๋ฐฉ์์ด ์์์ ธ ๋์ค๊ณ ์๋ค. ๋จ์ํ EDA์ ์ ์ ์ธ๊ทธ๋จผํธ๋ฅผ ํตํ ๊ฒํฅ๊ธฐ ์์ด ์๋๋ผ, ์์ธก ๋ชจํ๊น์ง ํ๋ฐํ๊ฒ ์ฌ์ฉ๋๊ณ ์๋ ๋ฏ ํ๋ค.
์์๋ก BC์นด๋์์ 'BC IDEA'๋ผ๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๊ธฐ์ ๋ง์ถคํ ๋น ๋ฐ์ดํฐ ๋ถ์ ์๋น์ค๋ฅผ ์ถ์ํ๋ฉด์, ์๊ถ ๋ถ์์ ํตํด ๊ธฐ์ ์ ๋์ฆ์ ๋ง๋ ์กฐ๊ฑด์ ์ถ์ฒํ๋ฉฐ, ๋จ์ํ ์ ๋ณด ์ ๊ณต์ ๋์ด์ ์ ์๊น์ง๋ ์ด๋ฃจ์ด์ง๊ณ ์๋ ๊ฒ์ด๋ค. ์๋ ๊ธฐ์ฌ์์ ๋ณด๋ฉด ์์ฒด ๋ชจ๋ธ์ ํตํด ํด๋น ์ง์ญ ๋ด 3km ๋ด ์ ์ฌ ์ ํฌ, ์ ๋ ์ธ๊ตฌ ๋ถ์(์๋, ๊ฐ๊ตฌ ํํฉ ๋ฑ)์ ํตํด ์ ํฌ๋ณ ์์ ์ฑ๊ณผ ์ฑ์ฅ์ฑ์ ์์ธกํ๋ค๊ณ ๋์ด์๋ค. ์๋ฅผ ๋ค์ด A์ง์ญ์ CU ํธ์์ ์ ๋ด๊ณ ์ ํ ๊ฒฝ์ฐ, ๊ทผ๋ฐฉ 3km ๋ด์ ํธ์์ ์ด๋ ์ํผ, ๋ง์ผ ๋ฑ ์๋ฃํ์ ์ด ๋ช ๊ฐ ์ ๋ ๋ถํฌํ๋์ง, ์ฌ๋๋ค์ด ๋ง์ด ์ง๋๊ฐ๋ ๊ธธ๋ชฉ์ธ์ง(ํฐ๊ธธ์ธ์ง ๊ณจ๋ชฉ์ธ์ง๋ ํ๋จ์ด ๋ ๊น?), ๊ทผ๋ฐฉ์ ์ฌ๋ ์ฃผ๋ฏผ๋ค์ ์์ ์๋๋ถ์๋ ์ด๋ป๊ฒ ๋ถํฌํ๋์ง ๋ฅผ ์๋ฏธํ๋ ๊ฒ ๊ฐ๋ค. ์ฌ๊ธฐ์ ๋ ๋ง์ถคํ๋ถ์์ ํด๋ณด์๋ฉด ํธ์์ ์ ๋ง๋ ๋ณ์๋ฅผ ๋ฃ์ด ์ค ์ ์๋ค. ์ฃผ๋ณ์ ํ๊ต๋ ํ์์ด ์๋์ง, ์๋๋ฉด ํ์ฌ๊ฐ ์๋์ง ๋ณด๊ณ , ํธ์์ ์ ๋ฌผ๊ฑด์ ๋ค๋ฅด๊ฒ ์ถ์ฒํด์ค ์๋ ์์ ๊ฒ์ด๊ณ , ํ๊ต๋ ํ์์ด ์์๋ค๋ฉด ํ์๋ค์ ๋ฑํ๊ต ์๊ฐ์ ๋ง์ถฐ ๋ฌผ๋์ด ์ฑ์์ง ์ ์๋๋ก ์กฐ์ธ๋ ๊ฐ๋ฅํ ๊ฒ์ด๋ค.
https://biz.newdaily.co.kr/site/data/html/2021/08/03/2021080300016.html
๋น์จ์นด๋, ๋น ๋ฐ์ดํฐ ๋ถ์ ์๋น์ค 'IDEA' ์ถ์…๋ง์ถคํ ๋น์ฆ๋์ค ์ง์
๋น์จ์นด๋(BC์นด๋)๋ ๊ตญ๋ด์ธ ๊ธฐ์ , ๊ณต๊ณต๊ธฐ๊ด, ๋ํ ๋ฑ๊ณผ ์ถ์ ํ ๋ฐ์ดํฐ ์ญ๋ ๊ธฐ๋ฐ์ผ๋ก ๊ธฐ์ ๋ง์ถคํ ๋น ๋ฐ์ดํฐ ๋ถ์ ์๋น์ค ‘BC IDEA’๋ฅผ ์ถ์ํ๋ค๊ณ 3์ผ ๋ฐํ๋ค. BC IDEA(Intelligence Data for Enterprise Advanc
biz.newdaily.co.kr
๋ํ, ๋ธ๋ก๊ทธ์ ๋ฐฉ๋ฌธ์ ์๊ฐ ์ค์ง ๊ด๊ณ ํจ๊ณผ์๋ง ์ํฅ์ ๋ฐ์๋ค๋ฉด ๋ชจํ์์ ํตํด ์์ธก์ด ๊ฐ๋ฅํ ํ ์ง๋ง, ๊ด๊ณ ๋ฟ๋ง ์๋๋ผ ์ฌํ์ ์ธ ์ด์์ ๋ง๋ฌผ๋ ธ๋ค๊ฑฐ๋, SNS์์ ํซํ ์ฃผ์ ๋ผ๊ฑฐ๋ ํ ๊ฒฝ์ฐ ์ฌ๋ฌ ํจ๊ณผ์ ๋ํด ์ธก์ ํ๋ ๋ฐฉ๋ฒ๋ก ๋ ์ฐพ์๋ณด๋ฉด ์ข์ ๊ฒ ๊ฐ๋ค.
์ฐธ๊ณ ๋ฌธํ
https://research.google/pubs/pub41854/
โถ ๋ ผ๋ฌธ๋ช : INFERRING CAUSAL IMPACT USING BAYESIAN STRUCTURAL TIME-SERIES MODELS
Inferring causal impact using Bayesian structural time-series models – Google Research
An important problem in econometrics and marketing is to infer the causal impact that a designed market intervention has exerted on an outcome metric over time. In order to allocate a given budget optimally, for example, an advertiser must assess to what e
research.google
โถ {CausalImpact} package in R
http://google.github.io/CausalImpact/
'๊ณ๋ฐ๐พ > ๋ถ์ ๋ฐฉ๋ฒ๋ก ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
A/B TEST (3) | 2021.11.09 |
---|