간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~31권2호(2018) |수록논문 수 : 1,752
응용통계연구
31권2호(2018년 04월) 수록논문
최근 권호 논문
| | | |

KCI등재

1Minard의 정보맵과 함께 하는 스토리텔링을 이용한 데이터시각화 교육

저자 : 장대흥 ( Dae-heung Jang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 167-188 (22 pages)

다운로드

(기관인증 필요)

초록보기

Minard의 정보맵은 1812년 나폴레옹의 러시아침공을 묘사한 정보그래픽스로서 Tufte (1983)가 극찬하였던 그림이다. 이 정보그래픽스를 데이터시각화교육에서 스토리텔링 소재로서 활용할 수 있다. 본 논문에서 Minard의 정보맵을 시작점으로 하여 스토리텔링을 이용한 데이터시각화 교육에 대하여 4개의 주제(정보그래픽스, 정보디자인, Minard, 나폴레옹의 러시아침공)별로 언급하였다.


Minard's figurative map is an infographic on Napoleon's Russian Campaign of 1812. Tufte (The Visual Display of Quantitative Information, Graphics Press, 1983) declared that Napoleon's March “may well be the best statistical graphic ever produced.” We can use this data map as storytelling material for data visualization education. In this paper, with Minard's figurative map, we study four themes (infographics, information design, Minard, and the Russian Campaign) in data visualization education.

KCI등재

2광, 공업용 건물의 전기 사용량에 대한 시계열 분석

저자 : 김민아 ( Minah Kim ) , 김재희 ( Jaehee Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 189-204 (16 pages)

다운로드

(기관인증 필요)

초록보기

본 연구는 2014년 1월부터 2017년 4월까지 광, 공업용 제조업을 하는 건물(GGM)의 전기 사용량에 대한 예측을 살펴보고자 한다. SARIMA, SARIMA + GARCH, Holt-Winters 방법, Fourier 변환으로 분해를 한 ARIMA 모형을 중심으로 네 가지 모형에 대한 적합을 하였다. 또한 2017년 5월 사용량에 대한 예측하고, 실제값을 고려하여 각 모형에 대해 예측 제곱근 평균 제곱 오차와 예측 오차율을 비교하였다. GGM 건물의 전기 사용량에 대한 변동이 심하기 때문에 여러 가지 모형 중에서도 변동성과 주기를 함께 고려한 SARIMA + GARCH 모형의 적합과 예측이 가장 뛰어난 것을 확인하였다.


This study is on forecasting the electricity consumption of an industrial manufacturing building called GGM from January 2014 to April 2017. We fitted models using SARIMA, SARIMA + GARCH, Holt-Winters method and ARIMA with Fourier transformation. We also forecasted electricity consumption for one month ahead and compared the predicted root mean square error as well as the predicted error rate of each model. The electricity consumption of GGM fluctuates weekly and annually; therefore, SARIMA + GARCH model considering both volatility and seasonality, shows the best fit and prediction.

KCI등재

3비대칭형 분계점 실현변동성의 제안 및 응용

저자 : 김지연 ( J. Y. Kim ) , 황선영 ( S. Y. Hwang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 205-216 (12 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 모형 기반 GARCH 변동성, 실현변동성(realized volatility; RV), 역사적 변동성(historical volatility), 지수가중이동평균(exponentially weighted moving average; EWMA) 등 다양한 변동성 추정 방법을 소개하고, 실현변동성에 비대칭 효과(leverage effect)를 반영한 분계점 실현변동성(threshold-asymmetric realized volatility; T-RV)을 제안하였다. 또한, 예시를 위해 KOSPI 고빈도 수익률 자료의 변동성을 분석하였다.


This paper is concerned with volatility computations for high frequency time series. A threshold-asymmetric realized volatility (T-RV) is suggested to capture a leverage effect. The T-RV is compared with various con-ventional volatility computations including standard realized volatility, GARCH-type volatilities, historical volatility and exponentially weighted moving average volatility. High frequency KOSPI data are analyzed for illustration.

KCI등재

4공간회귀모형을 이용한 토지시세가격 추정

저자 : 최지혜 ( Jihye Choi ) , 진향곤 ( Hyang Gon Jin ) , 김용구 ( Yongku Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 217-228 (12 pages)

다운로드

(기관인증 필요)

초록보기

부동산 투기근절, 공평과세 목적으로 부동산 실거래 신고제도가 도입된 이후, 정부에서 운영 중인 부동산거래관리시스템에는 연간 약 200만 건의 부동산 실거래 신고자료가 축적되고 있다. 인터넷이 발달하고 정보에 대한 접근성이 높아진 요즘, 부동산 투자에 대한 관심 증가로 부동산 가격정보에 대한 요구도 나날이 증가하고 있다. 하지만 이는 단순히 거래사례에 대한 정보만을 제공할 뿐이라 공동주택 실거래의 경우 동, 호수, 토지건물 실거래의 경우 지번을 개인정보보호 등의 이유로 공개하고 있지 않아 실거래의 위치별 정확한 데이터를 구득하기 어려운 실정이어서 정보의 비대칭성이 여전히 존재하고 이러한 부동산 정보의 특수성이 부동산시장에서의 투기가 근절되지 않는 이유 중 하나이다. 본 논문에서는 축적된 실거래 신고가격 데이터를 활용하여 실거래 미발생 지점에 대한 시세가격 추정 모형을 도출하는 것으로, 부동산 가격이 지리적 위치에 따라 결정되는 특수성을 가지는 것을 고려하여 공간구조가 반영될 수 있도록 공간회귀 모형을 통한 추정 토지 시세가격의 정확도를 살펴보았다.


Since the real estate reporting system was first introduced, about 2 million real estate transaction per year have been reported over the last 10 years with an increasing demand for real estate price estimates. This study looks at the applicability and superiority of the regression-kriging method to derive effective real transaction prices estimation on the location where information about real transaction is unavailable. Several issues on predicting the real estate price are discussed and illustrated using the real transaction reports of Jinju, Gyeongsangnam-do. Results have been compared with a simple regression model in terms of the mean absolute error and root square error. It turns out that the regression-kriging model provides a more effective estimation of land price compared to the simple regression model. The regression-kriging method adequately reflects the spatial structure of the term that is not explained by other characteristic variables.

KCI등재

5시간적 계층을 이용한 교통사고 발생건수 예측

저자 : 전관영 ( Gwanyoung Jun ) , 성병찬 ( Byeongchan Seong )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 229-239 (11 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 시간적 계층 개념을 활용하여 시계열 자료를 예측하는 방법을 소개한다. 횡단적 계층 자료 분석에서와 유사한 방법으로 중복되지 않는 시간적 계층을 시계열 자료에 구조화할 수 있다. 이러한 시간적 계층을 활용하여 조정된 예측은 기존의 계층별 독립적 기저 예측 및 상향식 예측보다 더 정확하고 강건한 예측값을 생성한다. 실증분석으로서 국내 교통사고 발생건수를 시간적 계층 개념을 활용하여 예측한다. 분석 결과, 조정 예측이 기존의 다른 예측보다 예측 성능면에서 더 우수함을 확인할 수 있다.


This paper introduces how to adopt the concept of temporal hierarchies to forecast time series data. Similarly as in hierarchical cross-sectional data, temporal hierarchies can be constructed for any time series data by means of non-overlapping temporal aggregation. Reconciliation forecasts with temporal hierarchies result in more accurate and robust forecasts when compared with the independent base and bottom-up forecasts. As an empirical example, we forecast traffic accident counts with temporal hierarchies and observe that reconciliation forecasts are superior to the base and bottom-up forecasts in terms of forecast accuracy.

KCI등재

6유전자집합분석에서 순열검정의 대안

저자 : 이선호 ( Sunho Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 241-251 (11 pages)

다운로드

(기관인증 필요)

초록보기

마이크로어레이 자료의 유전자집합분석은 개별유전자분석에 비해 검정력도 높일 수 있고 결과 해석이 쉬워서 이에 대한 연구가 활발히 진행되어 왔다. 표현형에 따라 유의한 차이를 보이는 유전자집합의 검색은 검정통계량들이 유도된 배경에 따라 결과에 차이를 보이지만 대체적으로 t-통계량의 제곱합을 이용한 순열검정이 제일 무난한 방법으로 여겨진다. 그러나 유전자집합분석에서 다중검정은 필수이고 많은 집합들의 유의성에 변별력을 주기 위해서는 순열검정에서 생성하는 치환표본의 수가 많이 필요하고 시간이 오래 걸린다는 문제점이 있다. 순열검정을 대신할 모수적 방법들을 검토한 결과, 적률을 이용한 근사가 각 집합의 유의확률 계산시간도 훨씬 단축하며 순열검정에서 구한 유의확률과 크기와 순위가 거의 일치함을 확인하였다.


The analysis of gene sets in microarray has advantages in interpreting biological functions and increasing statistical powers. Many statistical methods have been proposed for detecting significant gene sets that show relations between genes and phenotypes, but there is no consensus about which is the best to perform gene sets analysis and permutation based tests are considered as standard tools. When many gene sets are tested simultaneously, a large number of random permutations are needed for multiple testing with a high computational cost. In this paper, several parametric approximations are considered as alternatives of the permutation distribution and the moment based gene set test has shown the best performance for providing p-values of the permutation test closely and quickly on a general framework.

KCI등재

7희소 부분 최소 제곱법을 이용한 우리나라 청소년 인터넷 중독 자료 분석

저자 : 한정섭 ( Jeongseop Han ) , 박수빈 ( Soobin Park ) , 이동환 ( Donghwan Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 253-263 (11 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 우리나라 청소년의 인터넷 중독 자료를 희소 부분 최소제곱법을 적용 하여 분석하였다. 서울 성모병원에서 수집된 자가보고 방식의 인터넷 중독 측도와 다양한 임상 및 정신 병리학적 설문 문항들을 자료로 활용하였다. 표본의 개수보다 설문 문항의 수가 많은 고차원 자료이며, 각 세부문항끼리는 상관관계가 높아 부분 최소제곱법이 좋은 회귀분석 모형이다. 보다 높은 예측 성능과 해석력을 얻기위해 희소성 제약 조건이 가능한 희소 부분 최소제곱법을 이용하였고, 2가지 다른 벌칙함수를 이용하여 가장 좋은 방법을 선택하였다. 또한, 제안된 최종 모형을 통해 인터넷 중독이 임상 및 정신 병리학적 측도들로 잘 설명됨을 보이고, 공격성과 관련된 다른 설문 문항이 설문 문항이 모형의 잠재성분을 구별하고 설명하는데 역할을 한다는 유의미한 결과를 도출하였다.


Internet addiction in adolescents is an important social issue. In this study, sparse partial least-squares regression (SPLS) was applied to internet addiction data in Korean adolescent samples. The internet addiction score and various clinical and psychopathological features were collected and analyzed from self-reported questionnaires. We considered three PLS methods and compared the performance in terms of prediction and sparsity. We found that the SPLS method with the hierarchical likelihood penalty was the best; in addition, two aggression features, AQ and BSAS, are important to discriminate and explain latent features of the SPLS model.

KCI등재

8심층 신경망모형을 사용한 미세먼지 PM10의 예측

저자 : 전성현 ( Seonghyeon Jeon ) , 손영숙 ( Young Sook Son )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 265-285 (21 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 미세먼지 PM10의 4가지 분류 등급인 '좋음, 보통, 나쁨, 매우 나쁨' 그리고 2가지 분류 등급인 '좋음 혹은 보통, 나쁨 혹은 매우 나쁨'을 예측하기 위해서 심층 신경망모형을 사용하였다. 2010년부터 2015년까지 국내 6개 대도시 지역에서 관측한 일별 미세먼지 데이터에 대하여 기존 분류기법인 신경망모형, 다항 로지스틱 회귀모형, Support Vector Machine, Random Forest을 적용했을 때에 비해서 심층 신경망모형의 정확도는 더 높아졌다.


In this study, we applied a deep neural network model to predict four grades of fine dust PM10, 'Good, Moderate, Bad, Very Bad' and two grades, 'Good or Moderate and Bad or Very Bad'. The deep neural network model and existing classification techniques (such as neural network model, multinomial logistic regression model, support vector machine, and random forest) were applied to fine dust daily data observed from 2010 to 2015 in six major metropolitan areas of Korea. Data analysis shows that the deep neural network model outperforms others in the sense of accuracy.

KCI등재

9랜덤효과를 포함한 영과잉 포아송 회귀모형에 대한 베이지안 추론: 흡연 자료에의 적용

저자 : 김연경 ( Yeon Kyoung Kim ) , 황범석 ( Beom Seuk Hwang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 287-301 (15 pages)

다운로드

(기관인증 필요)

초록보기

0이 과도하게 많이 나타나는 자료는 여러 다양한 분야에서 흔히 볼 수 있다. 이러한 자료들을 분석할 때 대표적으로 영과잉 포아송 모형이 사용된다. 특히 반응변수들 사이에 상관관계가 존재할 때에는 랜덤효과를 영과잉 포아송 모형에 도입해서 분석해야 한다. 이러한 모형은 주로 빈도론자들의 접근방법으로 분석되어왔는데, 최근에는 베이지안 기법을 사용한 분석도 다양하게 발전되어 왔다. 본 논문에서는 반응변수들 사이에 상관관계가 존재하는 경우 랜덤효과가 포함된 영과잉 포아송 회귀모형을 베이지안 추론 방법을 토대로 제안하였다. 이 모형의 적합성을 판단하기 위해 모의 실험을 통해 랜덤효과를 고려하지 않은 모형과 비교 분석하였다. 또한, 실제 지역사회 건강조사 흡연 자료에 직접 응용하여 그 결과를 살펴보았다.


It is common to encounter count data with excess zeros in various research fields such as the social sciences, natural sciences, medical science or engineering. Such count data have been explained mainly by zero-inflated Poisson model and extended models. Zero-inflated count data are also often correlated or clustered, in which random effects should be taken into account in the model. Frequentist approaches have been commonly used to fit such data. However, a Bayesian approach has advantages of prior information, avoidance of asymptotic approximations and practical estimation of the functions of parameters. We consider a Bayesian zeroinflated Poisson regression model with random effects for correlated zero-inflated count data. We conducted simulation studies to check the performance of the proposed model. We also applied the proposed model to smoking behavior data from the Regional Health Survey (2015) of the Korea Centers for disease control and prevention.

KCI등재

10전이함수모형을 이용한 약품비 지출의 예측

저자 : 박미혜 ( Mihai Park ) , 임민성 ( Minseong Lim ) , 성병찬 ( Byeongchan Seong )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 2호 발행 연도 : 2018 페이지 : pp. 303-313 (11 pages)

다운로드

(기관인증 필요)

초록보기

본 논문에서는 약품비 지출에 대한 예측을 수행하기 위하여 시계열 모형을 도입한다. 2012년 약가 일괄인하를 반영하기 위하여 구간별 모형을 토대로, 자기회귀오차모형과 전이함수모형을 고려하였다. 자기회귀오차모형에서는 예측의 편리성을 위하여 결정적 추세만을 고려하였으며, 전이함수모형에서는 주요한 외생변수와의 교차상관성을 이용하여 약품비 지출의 인과 메커니즘을 설명하였다. 각 모형에서 약가 일괄인하 이후 수준 변화가 유의하게 나타났으며, 전이함수모형에서는 의약품 사용자 수 및 노인환자 비중 시계열 변수가 유의하게 나타났다. 자기회귀오차모형은 약가 일괄인하로 의한 약품비 수준이동에 좌우되어 비교적 낮은 예측값이 도출되었으며, 전이함수모형은 약품비 지출에 영향을 미치는 외부 설명변수의 증가 추세가 적절히 반영되어 더 높은 예측값을 보였다. 설명변수를 포함하지 않을 경우, 약품비 수준이동만을 고려한 ARIMA 모형은 약품비 지출 추세를 가장 높이 예측하였다.


This study considers time series models to forecast drug expenditures in national health insurance. We adopt autoregressive error model (ARE) and transfer function model (TFM) with segmented level and trends (before and after 2012) in order to reflect drug price reduction in 2012. The ARE has only a segmented deterministic term to increase the forecasting performance, while the TFM explains a causality mechanism of drug expenditure with closely related exogenous variables. The mechanism is developed by cross-correlations of drug expenditures and exogenous variables. In both models, the level change appears significant and the number of drug users and ratio of elderly patients variables are significant in the TFM. The ARE tends to produce relatively low forecasts that have been influenced by a drug price reduction; however, the TFM does relatively high forecasts that have appropriately reflected the effects of exogenous variables. The ARIMA model without the exogenous variables produce the highest forecasts.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

연세대학교 고려대학교 서울대학교 이화여자대학교 경희대학교
 124
 94
 86
 75
 67
  • 1 연세대학교 (124건)
  • 2 고려대학교 (94건)
  • 3 서울대학교 (86건)
  • 4 이화여자대학교 (75건)
  • 5 경희대학교 (67건)
  • 6 중앙대학교(서울) (63건)
  • 7 성균관대학교 (53건)
  • 8 한양대학교 (47건)
  • 9 한국행정연구원 (41건)
  • 10 건국대학교 (30건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기