간행물

한국통계학회> 응용통계연구

응용통계연구 update

The Korean Journal of Applied Statistics

  • : 한국통계학회
  • : 자연과학분야  >  통계학
  • : KCI등재
  • :
  • : 연속간행물
  • : 격월
  • : 1225-066x
  • : 2383-5818
  • :

수록정보
수록범위 : 1권1호(1987)~31권5호(2018) |수록논문 수 : 1,780
응용통계연구
31권5호(2018년) 수록논문
최근 권호 논문
| | | |

KCI등재

1표정 분류 연구

저자 : 손나영 ( Nayeong Son ) , 조현선 ( Hyunsun Cho ) , 이소현 ( Sohyun Lee ) , 송종우 ( Jongwoo Song )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 539-554 (16 pages)

다운로드

(기관인증 필요)

초록보기

최근 등장하는 다양한 사물인터넷 기기 혹은 상황인식 기반의 인공지능에서는 사용자와 기기의 상호작용이 중요시 된다. 특히 인간을 대상으로 상황에 맞는 대응을 하기 위해서는 인간의 표정을 실시간으로 인식하여 빠르고 정확한 판단을 내리는 것이 필요하다. 따라서, 보다 빠르고 정확하게 표정을 인식하는 시스템을 구축하기 위해 얼굴 이미지 분석에 대한 많은 연구들이 선행되어 왔다. 본 연구에서는 웹사이트 Kaggle에서 제공한 48*48 8-bit grayscale이미지 데이터셋을 사용하여 얼굴인식과 표정분류로 구분된 두 단계를 거치는 얼굴표정 자동 인식 시스템을 구축하였고, 이를 기존의 연구와 비교하여 자료 및 방법론의 특징을 고찰하였다. 분석 결과, Face landmark 정보에 주성분분석을 적용하여 단 30개의 주성분만으로도 빠르고 효율적인 예측모형을 얻을 수 있음이 밝혀졌다. LDA, Random forest, SVM, Bagging 중 SVM방법을 적용했을 때 가장 높은 정확도를 보이며, LDA방법을 적용하는 경우는 SVM 다음으로 높은 정확도를 보이며, 매우 빠르게 적합하고 예측하는 것이 가능하다.


Effective interaction between user and device is considered an important ability of IoT devices. For some applications, it is necessary to recognize human facial expressions in real time and make accurate judgments in order to respond to situations correctly. Therefore, many researches on facial image analysis have been preceded in order to construct a more accurate and faster recognition system. In this study, we constructed an automatic recognition system for facial expressions through two steps - a facial recognition step and a classification step. We compared various models with different sets of data with pixel information, landmark coordinates, Euclidean distances among landmark points, and arctangent angles. We found a fast and efficient prediction model with only 30 principal components of face landmark information. We applied several prediction models, that included linear discriminant analysis (LDA), random forests, support vector machine (SVM), and bagging; consequently, an SVM model gives the best result. The LDA model gives the second best prediction accuracy but it can fit and predict data faster than SVM and other methods. Finally, we compared our method to Microsoft Azure Emotion API and Convolution Neural Network (CNN). Our method gives a very competitive result.

KCI등재

2비모수 베이지안 방법을 이용한 영상 잡음 제거 알고리즘

저자 : 우호영 ( Ho-young Woo ) , 김영화 ( Yeong-hwa Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 555-572 (18 pages)

다운로드

(기관인증 필요)

초록보기

영상처리 분야의 중요한 주제인 영상의 잡음 제거 과정은 원래의 순수한 영상이 다양한 원인으로 발생한 잡음에 의해 오염되었을때 이 잡음을 제거하거나 줄이는 것을 의미한다. 잡음 제거 과정에서는 영상에 추가된 잡음과 원 영상이 가진 고유한 특징들을 구별해내는 것이 중요하며 이에 대한 많은 연구가 진행되고 있다. 적응적 필터와 시그마 필터는 잡음 제거를 위하여 사용하는 대표적인 잡음 제거 필터이며 이 필터들의 효용성은 정확한 잡음 추정에 영향을 받는다. 따라서 본 연구에서는 디리클레 정규 혼합모형을 토대로 영상을 오염시키고 있는 잡음의 분포를 생성하고 이를 토대로 영상의 특징과 잡음을 구별하기 위한 베이지안 방법을 제시한다. 특히 잡음의 분포와 특징의 분포를 구별하기 위해 베이지안 추론을 전개하고 영상에 포함된 잡음을 제거하는 알고리즘을 제시하고자 한다.


Noise reduction processes that reduce or eliminate noise (caused by a variety of reasons) in noise contaminated image is an important theme in image processing fields. Many studies are being conducted on noise removal processes due to the importance of distinguishing between noise added to a pure image and the unique characteristics of original images. Adaptive filter and sigma filter are typical noise reduction filters used to reduce or eliminate noise; however, their effectiveness is affected by accurate noise estimation. This study generates a distribution of noise contaminating image based on a Dirichlet normal mixture model and presents a Bayesian approach to distinguish the characteristics of an image against the noise. In particular, to distinguish the distribution of noise from the distribution of characteristics, we suggest algorithms to develop a Bayesian inference and remove noise included in an image.

KCI등재

3제 2형 당뇨병을 이용한 로지스틱과 베이지안 노모그램 구축 및 비교

저자 : 박재철 ( Jae-cheol Park ) , 김민호 ( Min-ho Kim ) , 이제영 ( Jea-young Lee )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 573-585 (13 pages)

다운로드

(기관인증 필요)

초록보기

본 연구에서는 제 2형 당뇨(type 2 diabetes mellitus)의 발병 확률을 예측하기 위해 11가지 위험요인을 가지고 로지스틱 회귀모형과 순수 베이지안 분류기 모형에 적합시킨다. 그런 다음 이를 시각적으로 쉽게 이해하는데 도움을 주는 노모그램 구축 방법을 소개한다. 분석은 2013-2015년 6기 국민건강영양조사 데이터를 가지고 분석하였다. 또 로지스틱 회귀모형에 세 가지 상호작용 항을 넣어 분석의 질을 높이고자 하였고 베이지안 노모그램에 left-aligned방법을 사용하여 비교하기 쉽게 만들었다. 최종적으로 두 노모그램을 비교하고 효용성을 알아보았다. 마지막으로 ROC 곡선을 이용하여 노모그램이 적절한지 검증하였다.


In this study, we fit the logistic regression model and naive Bayesian classifier model using 11 risk factors to predict the incidence rate probability for type 2 diabetes mellitus. We then introduce how to construct a nomogram that can help people visually understand it. We use data from the 2013-2015 Korean National Health and Nutrition Examination Survey (KNHANES). We take 3 interactions in the logistic regression model to improve the quality of the analysis and facilitate the application of the left-aligned method to the Bayesian nomogram. Finally, we compare the two nomograms and examine their utility. Then we verify the nomogram using the ROC curve.

KCI등재

4계속조사에서 응답률을 반영한 표본크기

저자 : 박현아 ( Hyeonah Park ) , 나성룡 ( Seongryong Na )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 587-597 (11 pages)

다운로드

(기관인증 필요)

초록보기

조사목적에 부합하는 표본 자료를 얻기 위해서는 추출방법 및 조사방법 결정, 설문지 작성 등의 절차가 필요하며 중요한 결정 중 하나가 표본크기 공식의 적용이다. 표본크기 공식은 추출방법에 따른 목표오차와 총비용 등을 설정함으로써 결정되는데 본 논문에서는 단순임의추출에서 목표오차와 예상 응답률이 주어져 있을 때 과거 및 현재 시점의 모집단의 변동과 과거 자료의 추정오차 및 응답률을 사용한 표본크기 공식을 제안한다. 실제조사에서는 설계가중치 외에도 여러 가중치가 복합적으로 적용되는 추정량을 사용하고 있는데 본 논문에서는 설계가중치와 무응답 보정계수를 사용한 추정량에서의 표본크기 공식을 유도하며 이것은 시점별 조사방법이 달라질 경우 응답률에 차이가 발생하는 현상을 반영한 공식이 될 수 있다. 또한 모의 실험을 통하여 기존의 표본크기 공식과 비교함으로써 제안된 공식의 다양한 적용방안을 살펴본다.


Procedures, such as sampling technique, survey method, and questionnaire preparation, are required in order to obtain sample data in accordance with the purpose of a survey. An important procedure is the decision of the sample size formula. The sample size formula is determined by setting the target error and total cost according to the sampling method. In this paper, we propose a sample size formula using population changes over time, estimation error of the previous time and response rate of past data when the target error and the expected response rate are given in the simple random sampling. In actual research, we use estimators that apply complex weights in addition to design-based weights. Therefore, we induce a sample size formula for estimators using design-based weights and nonresponse adjustment coefficients, that can be a formula that reflects differences in response rates when survey methods are changed over time. In addition, we use simulations to compare the proposed formula with the existing sample size formula.

KCI등재

5반복이 있는 랜덤화 블록 모형에서 정렬방법과 결합위치를 이용한 비모수 다중비교법

저자 : 황주원 ( Juwon Hwang ) , 김동재 ( Dongjae Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 599-610 (12 pages)

다운로드

(기관인증 필요)

초록보기

반복이 있는 랜덤화 블록 모형(randomized block design with replications)에서 비모수 다중비교 방법으로는 Mack과 Skillings (Technometrics, 23, 171-177, 1981) 방법이 있다. 이 방법은 각 블록의 처리에서 반복된 관측값 대신 관측값들의 평균을 이용해 순위를 매기기 때문에 정보의 손실이 발생할 가능성이 있다. 이를 보완하기 위해 본 논문에서는 Hodges와 Lehmann (The Annals of Mathematical Statistics, 33, 482-497, 1962)이 제안한 정렬방법과 Chung과 Kim (Communications for Statistical Applications and Methods, 14, 551-560, 2007)이 제안한 결합위치 검정법을 확장하여 반복이 있는 랜덤화 블록 모형에서 새로운 비모수 다중비교 방법을 제시하였다. 또한 몬테카를로 모의실험(Monte Carlo simulation)을 통해 모수적 방법과 기존의 비모수적 방법과의 family wise error rate (FWE)와 검정력을 비교하였다.


The method of Mack and Skillings (Technometrics, 23, 171-177, 1981) is a nonparametric multiple comparison method in a randomized block design with replications. This method is likely to result in loss of information because each block is ranked using the average of observations instead of repeated observations. In this paper, we proposed a new nonparametric multiple comparison method in the randomized block model with replications using an alignment method proposed by Hodges and Lehmann (The Annals of Mathemat-ical Statistics, 33, 482-497, 1962) that extend the joint placement method proposed by Chung and Kim (Communications for Statistical Applications and Methods, 14, 551-560, 2007). In addition, Monte Carlo simulation compared the family wise error rate and power with the parametric method and the nonparametric method.

KCI등재

660, 81mm 박격포탄의 저장수명 요인 연구

저자 : 장수희 ( Soohee Jang ) , 전희주 ( Heuiju Chun ) , 조인호 ( Inho Cho ) , 윤근식 ( Keunsig Yoon ) , 강민정 ( Minjung Kang ) , 박동수 ( Dongsoo Park )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 611-620 (10 pages)

다운로드

(기관인증 필요)

초록보기

ASRP(Ammunition Stockpile Reliability Program; 저장탄약신뢰성평가) 업무는 인적, 물적 문제로 인하여 모든탄에 대해 주기적 검사 수행이 어려운 실정으로, 저장탄약 수명예측 연구는 효율적인 ASRP 업무 수행에 기여할 수 있다. 본 연구는 2003년 2016년에 수행한 60,81mm 박격포탄약에 대한 ASRP 결과를 기초로 저장수명 요인을 연구하였다. 기존의 수명예측 연구에서 저장기간을 주요 독립변인으로 분석한 연구방법과는 다르게, 탄약고형태, 기상요인 등 저장환경을 독립변인으로 Cox의 비례위험모형을 활용하여 분석하였다. 그 결과 60, 81mm 박격포탄의 저장수명에 영향을 미치는 요인은 탄약고형태, 최고온도 요인, 강수량 요인으로 분석되었다.


Limitations on human and material resources make it is difficult to conduct Ammunition Stockpile Reliability Program (ASRP) tasks for the entire ammunition. Stockpile ammunition life prediction studies can contribute to efficient ASRP tasks. This study assess the shelf-life of ammunition, using survival analysis based on ASRP results for 60mm and 81mm mortar ammunition from 2003 to 2016. Traditional assessments often use solely storage duration as the only main independent variable; however, this assessment used other factors such as ammunition magazine shape and weather factors with the stockpile shelf-life as independent variables to conduct a Cox's proportional hazard model analysis. This was then followed by an assessment of ammunition magazine type, maximum temperature and rainfall factors influence on the shelf-life of 60mm and 81mm mortar ammunition. As a result, the type of ammunition magazine, maximum temperature and the rainfall influence the shelf-life of 60mm and 81mm mortar ammunition.

KCI등재

7모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구

저자 : 민주원 ( Joo-won Min ) , 신기일 ( Key-il Shin )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 621-636 (16 pages)

다운로드

(기관인증 필요)

초록보기

정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.


Research on the application of informative sampling technique has been conducted in order to reduce the influence of non-response. Chung and Shin (Korean Journal of Applied Statistics, 30, 993-1004, 2017) showed that the estimation accuracy improved when using exponential response rate information for the parameter estimation if the distribution of errors included in the super population model follows normal distribution. However this method divides the stratum into equally spaced substrata to obtain the sample weight of the informative sampling technique and shows that the accuracy of the estimation improves as the number of substrata increases. In this study, with the given number of total sample size, the optimal substratum boundary points are calculated using equal space, quantile, and LH algorithm; consequently, the results using those methods are compared through simulation. We also studied the criteria to determine the number of substrata and substratum boundaries that can be used in practice with various types of auxiliary variable distributions.

KCI등재

8우리나라 사망력 모형의 변천과 가정 고찰 - Lee-Carter 류를 중심으로 -

저자 : 오진호 ( Jinho Oh ) , 김순영 ( Soon-young Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 637-653 (17 pages)

다운로드

(기관인증 필요)

초록보기

빠른 고령화로 고령층의 증가는 인구구조 변화와 인구고령화에 영향을 미친다. 예전부터 선진국은 인구고령화를 주요현안으로 간주하여 고령화로 인한 연금 재정건전성, 건강 및 노인 복지 시스템의 지속 가능성에 집중하고 있다. 이처럼 고령층의 증가로 인구구조 변화와 인구고령화에 미치는 사망률 예측은 어느 때보다도 중요하다. 본 논문은 통계청 1970-2016년 각세별 생명표 자료를 활용하여 사망률 모형 6가지를 비교하였다. 이들 모형은 Lee-Carter(LC) 모형 (Lee and Carter, Journal of the American Statistical Association, 87, 659-671, 1992)에 근원을 두고 있으며, LC 의 가정을 수정하고 개선한 것이다. 이들 개선과정과 가정검토를 모형별로 살펴보고 우리나라에 적합한 사망률 모형을 모색했다. 분석결과 빠른 고령화와 연령별 사망률의 개선 효과를 보이는 우리나라의 경우 기대수명에 큰 변화를 주지 않고 이들 현상을 반영하고 연령별 사망률 패턴을 수정하는 LC-ER 모형 (Li 등, Demography, 50, 2037-2051, 2013)과 Li-Lee 모형과 LC-ER모형을 조합한 LL&LC-ER 모형으로 사망률을 예측하는 것이 바람직하다.


Rapid aging of the population affects population structure and population aging. Consequently, developed countries have focused on population aging as a major issue in regards to pension sustainability finances as well as health and the elderly welfare system. Mortality projections that result from population structure changes and population aging are increasingly important. This paper compares six mortality models using KOSTAT's life table from 1970 to 2016. The models are rooted in the Lee-Carter (LC) model (Lee and Carter, Journal of the American Statistical Association, 87, 659-671, 1992) and have been modified and improved on the assumptions of the LC model. We examined the improvement process and the check assumption by models in order to find a suitable mortality model for Korea. Korea shows rapid aging and declined mortality rate by age; therefore, it is desirable to estimate and predict mortality from LL&LC-ER models by combining LC-ER, LL, and LC-ER models that reflect the phenomena and modify age-specific mortality patterns without major changes in expected life expectancy.

KCI등재

9비정형 데이터 분석을 통한 선거 여론조사 예측력 개선 방안 연구

저자 : 박선빈 ( Sunbin Park ) , 김명준 ( Myung Joon Kim )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 655-665 (11 pages)

다운로드

(기관인증 필요)

초록보기

소셜 네트워크 서비스(social network service; SNS)는 개개인의 의견을 공유하거나 소통하는 일반적인 도구로 사용되고 있으며, 특히 정치적인 이슈의 전파 과정에서 타인과의 공유를 통하여 자신이 지지하는 후보에 대한 긍정적인 홍보 등을 통해 여론을 형성 또는 확장한다. 기존의 여론 조사 결과는 응답률, 표본 수집의 방식 등과 관련하여 예측의 정확성에 대한 끊임없는 논란이 되어왔다. 본 논문은 이러한 소셜 네트워크 서비스 상에 존재하는 수많은 비정형 데이터의 감성 분석을 통하여 여론조사의 예측력을 개선, 보완하는 방안을 제시하고자 한다. 제시하고자 하는 연구내용은 비정형 데이터 크롤링 및 기존에 사용되던 감성 사전에 대한 추가적인 보정 과정을 포함하고 있으며, 이를 통하여 본 논문에서 제안하는 방식은 오차의 감소를 통하여 예측력을 개선하는 결과를 나타냈다.


Social network services (SNS) have become the most common tool for the communication of public and private opinions as well as public issues; consequently, one may form or drive public opinions to advocate by spreading positive content using SNS. Controversy for survey data based opinion poll accuracy continues in relation to response rate or sampling methodology. This study suggests complementary measures that additionally consider the sentiment analysis results of unstructured data on a social network by data crawling and sentiment dictionary adjustment process. The suggested method shows the improvement of prediction accuracy by decreasing error rates.

KCI등재

10함수적 변동성 fGARCH(1, 1)모형을 통한 초고빈도 시계열 변동성

저자 : 윤재은 ( J. E. Yoon ) , 김종민 ( Jong-min Kim ) , 황선영 ( S. Y. Hwang )

발행기관 : 한국통계학회 간행물 : 응용통계연구 31권 5호 발행 연도 : 2018 페이지 : pp. 667-675 (9 pages)

다운로드

(기관인증 필요)

초록보기

초고빈도(ultra high frequency; UHF)시계열의 함수적 변동성 측정을 위한 최신 기법인 함수적 변동성 functional GARCH : fGARCH(1; 1) 모형을 소개하고 설명하였다. 실증분석을 위해 R-code fGARCH(1; 1) 프로그램을 KOSPI/현대차 초고빈도 수익률 자료에 적합하여 예시하였다.


When a _nancial time series consists of daily (closing) returns, traditional volatility models such as autoregressive conditional heteroskedasticity (ARCH) and generalized ARCH (GARCH) are useful to _gure out daily volatilities. With high frequency returns in a day, one may adopt various multivariate GARCH techniques (MGARCH) (Tsay, Multivariate Time Series Analysis With R and Financial Application, John Wiley, 2014) to obtain intraday volatilities as long as the high frequency is moderate. When it comes to the ultra high frequency (UHF) case (e.g., one minute prices are available everyday), a new model needs to be developed to suit UHF time series in order to _gure out continuous time intraday-volatilities. Aue et al. (Journal of Time Series Analysis, 38, 3{21; 2017) proposed functional GARCH (fGARCH) to analyze functional volatilities based on UHF data. This article introduces fGARCH to the readers and illustrates how to estimate fGARCH equations using UHF data of KOSPI and Hyundai motor company.

1
권호별 보기
가장 많이 인용된 논문

(자료제공: 네이버학술정보)

가장 많이 인용된 논문
| | | |
1연안해역에서 석유오염물질의 세균학적 분해에 관한 연구

(2006)홍길동 외 1명심리학41회 피인용

다운로드

2미국의 비트코인 규제

(2006)홍길동심리학41회 피인용

다운로드

가장 많이 참고한 논문

(자료제공: 네이버학술정보)

가장 많이 참고한 논문

다운로드

2미국의 비트코인 규제

(2006)홍길동41회 피인용

다운로드

해당 간행물 관심 구독기관

연세대학교 서울대학교 중앙대학교(서울) 고려대학교 이화여자대학교
 111
 89
 62
 59
 57
  • 1 연세대학교 (111건)
  • 2 서울대학교 (89건)
  • 3 중앙대학교(서울) (62건)
  • 4 고려대학교 (59건)
  • 5 이화여자대학교 (57건)
  • 6 성균관대학교 (42건)
  • 7 한양대학교 (39건)
  • 8 건국대학교 (37건)
  • 9 인하대학교 (36건)
  • 10 부산대학교 (34건)

내가 찾은 최근 검색어

최근 열람 자료

맞춤 논문

보관함

내 보관함
공유한 보관함

1:1문의

닫기