본문 바로가기

통계

q-values 출처: http://www.nonlinear.com/support/progenesis/comet/faq/v2.0/pq-values.aspx q-valuesQ-values are the name given to the adjusted p-values found using an optimised FDR approach. The FDR approach is optimised by using characteristics of the p-value distribution to produce a list of q-values. In what follows, I will tie up some ideas and hopefully this will help clarify what we have been saying ab.. 더보기
MDS PCA PCOA How to choose ordination method, such as PCA, CA, PCoA, and NMDS? - ResearchGate. Available from: https://www.researchgate.net/post/How_to_choose_ordination_method_such_as_PCA_CA_PCoA_and_NMDS [accessed Nov 23, 2016]. The choice of ordination methods depends on 1) the type of data you have, 2) the similarity distance matrix you want/can use, and 3) what you want to say. All of these ordination m.. 더보기
false positive, false negative, sensitivity, specificity @_@ 뱅글뱅글, false positive, 틀린것을 맞다고 하는것false negative, 맞는데도 틀리다고 하는것true positive, 맞는것을 맞다고 하는것true negative, 틀린것을 틀리다고 하는것 sensitivity, 옳은것이 옳다고 나오는 확률specificity, 틀린것이 틀리다고 나오는 확률 결과사실 결과거짓사실 TP FN거짓 FP TN sensitivity : 질병이 있는 환자에서 검사를 통해 질병이 있음을 가려낼 수 있는 능력검사결과사실 TP / (TP+FN) 전체사실인경우 X 100 specificity : 질병이 없는 환자에서 검사를 통해 질병이 없음을 가려낼 수 있는 능력검사결과거짓 TN / (TN+FP) 전체거짓인경우 X 100 positive predictive.. 더보기
Akaike information criterion Akaike information criterion, AICFrom Wikipedia, the free encyclopedia The Akaike information criterion is a measure of the relative goodness of fit of a statistical model. It was developed by Hirotsugu Akaike, under the name of "an information criterion" (AIC), and was first published by Akaike in 1974.[1] It is grounded in the concept of information entropy, in effect offering a relative measu.. 더보기
베이지안 모델, 보호되어 있는 글입니다. 더보기
마르코프 연쇄, Markov chain 마르코프 연쇄 마르코프 연쇄(Markov chain)는 마르코프 성질을 가진 이산 시간 확률 과정이다. 러시아 수학자인 안드레이 마르코프의 이름에서 왔다. 마르코프 연쇄는 시간에 따른 시스템 상태의 변화를 나타낸다. 매 시간마다 시스템은 상태를 바꾸거나 같은 상태를 유지한다. 상태의 변화를 전이라 한다. 마르코프 성질은 과거와 현재 상태가 주어졌을 때의 미래 상태의 조건부 확률 분포가 과거 상태와는 독립적으로 현재 상태에 의해서만 결정된다는 걸 뜻한다. 마르코프 연쇄는 마르코프 성질을 가진 랜덤변수 X1,X2,X3의 수열이고 현재의 상태는 과거의 상태와 미래의 상태와는 독립적이다. 즉, Xi는 연쇄의 상태공간(state space)라 불리는 셀 수 있는 집합 S의 원소이다. 마르코프 연쇄는 종종 edge.. 더보기
time series, 시계열 분석 시계열 자료 시계열(time series)이란 시간의 흐름에 따라 관찰된 자료를 뜻한다. 경영활동자료(판매량, 광고액, 재고량, 고객수), 경제자료(GNP, 물가지수, 주가지수, 총 수출액), 교통량, 기상자료, 대기오염자료, 신호처리, 지진파, 수문량 자료 등 많은 종류의 시계열이 있어 시계열 분석은 응용범위가 매우 넓은 통계적 분석 기법임을 알 수 있다. 경향(trend), 주기(cycle), 계절성(seasonality), 불규칙성(irregular) cross-sectional data univariate time series data analysis a set of observations generated sequentially in time 시계열 분석의 목적은 (1) 시계열을 발생시키는 확률.. 더보기
식생의 연속체설과 서열기법의 발전, 김준호 저, 한국 생태학 100년 중, 일부 발췌 미국의 Clements, F.E(1926)는 식물군락을 종이 결합한 복잡한 유기체 organismic metaphor 라고 인식하였다. 복잡한 유기체는 마치 한 생물체처럼 생장하고 성숙하며 죽는 실체라고 생각하였던 것이다. 이 착상은 거의 반세기 동안 미국 생태학계를 풍미하였다. Gleason, H.A.(1926)는 식물군락을 명확한 단위성을 가지는 유기체가 아니고 군락 구성종이 분포역의 환경구배에 따라 변하여 각 종마다 개별성 individualistic concept을 가진다는 식생연속체설 vegetational continuum theory을 주장하였다. 이 이론은 발표 당시에는 검정되지 않았지만, 그의 착상은 1950년대 이후 식생학 연구에 깊은 .. 더보기
Sørensen similarity index http://en.wikipedia.org/wiki/S%C3%B8rensen_similarity_index Sørensen similarity index From Wikipedia, the free encyclopedia The Sørensen index, also known as Sørensen’s similarity coefficient, is a statistic used for comparing the similarity of two samples. It was developed by the botanist Thorvald Sørensen and published in 1948. It is often misspelled as Sorenson index, Soerenson index and Söre.. 더보기
스크랩) 이 땅, 통계학의 오늘1 - 최종후 맨날쓰는 통계만 하다보니, 힘이 겹다 ;ㅡ; 새로운 아이디어와 그에 맞는 방법이 필요해 스크랩, 공부가 필요하다. 원문 http://www.isnews.co.kr/news/articleView.html?idxno=16724 I. 통계/확률 분야 소개 국가과학기술표준분류체계에 의거, 통계/확률의 분야소개를 (1)추론/계산, (2)모형/자료분석, (3)응용통계, (4)확률/확률과정의 4개 중분야별로 정리한다. 통계/확률분야는 현재에도 계속 응용영역을 확장하고 있으며 이에 따른 이론연구의 영역도 확장일로에 있다. 따라서 여기에 이 모든 분야의 소개와 연구동향을 분석하는 것이 불가능하며, 단지 현재 국내 연구자가 관심을 가지고 있는 대표적인 분야에 대해 기술함을 밝혀둔다. 1. 추론/계산 1.1. 모수/비모수추.. 더보기
[Biological Statistics] ANOVA, in SPSS ANOVA, analysis of variance 셋, 또는 그 이상의 독립적인 sample들에 대한 parametric test general assumptions of ANOVA 1. random sampling 2. continuous 3. ratio or interval scale 4. equal error variances 5. approximately normal distribution 위의 다섯가지 가정이 성립해야만 그룹간의 평균 비교에 ANOVA를 쓸 수 있다. (성립하지 않는다면 non parametric test로 ㄱㄱㅆ) (non parametric 연속된 수가 아닌 grade, class data를 비교하는 것이므로 당연히 엄청 rough한것임) 5번의 경우 n수가 많으면, 중심극한.. 더보기