통합 검색 | Korea Science

한국어 문장 분류 태스크에서의 효과적 분절 전략 (An Effective Segmentation Scheme for Korean Sentence Classification tasks)

김진성;김경민;손준영;임희석
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.173-177
- /
- 2021
분절을 통한 양질의 입력 자질을 구성하는 것은 언어모델의 문장에 대한 이해도를 높이기 위한 필수적인 단계이다. 분절은 문장의 의미를 이해하는 데 있어 중요한 역할을 하기 때문이다. 따라서, 한국어 문장 분류 태스크를 수행함에 있어 한국어의 특징에 맞는 분절 기법을 선택하는 것은 필수적이다. 명확한 판단 기준 마련을 위해, 우리는 한국어 문장 분류 태스크에서 가장 효과적인 분절 기법이 무엇인지 감성 분석, 자연어 추론, 텍스트 간 의미적 유사성 판단 태스크를 통해 검증한다. 이 때 비교할 분절 기법의 유형 분류 기준은 언어학적 단위에 따라 어절, 형태소, 음절, 자모 네 가지로 설정하며, 분절 기법 외의 다른 실험 환경들은 동일하게 설정하여 분절 기법이 문장 분류 성능에 미치는 영향만을 측정하도록 한다. 실험 결과에 따르면 자모 단위의 분절 기법을 적용한 모델이 평균적으로 가장 높은 성능을 보여주며, 반복 실험 간 편차가 적어 일관적인 성능 결과를 기록함을 확인할 수 있다.
PDF

동결-융해 반복작용에 노출되는 옹벽의 거동에 관한 수치해석 연구 (Numerical Investigation into Behavior of Retaining Wall Subject to Cycles of Freezing and Thawing)

유충식
- 한국지반공학회논문집
- /
- 제29권1호
- /
- pp.81-92
- /
- 2013
본 논문에서는 계절적 환경변화로 인한 동결-융해 반복과정에 노출되는 옹벽의 시간 의존적 거동에 대한 수치 해석 연구 내용을 다루었다. 이를 위해 먼저 동결-융해 반복과정에 노출되는 옹벽에 대한 열-수리-응력 연계해석 기반의 모델링 기법을 정립하였으며 이러한 모델링 기법을 토대로 다양한 온도변화 조건에 대한 매개변수 연구를 수행하였다. 그 결과 다양한 온도변화 특성 중 옹벽의 거동에 미치는 주된 영향인자는 계절적 평균동결온도와 반복회수인 것으로 나타났다. 반면 동결온도의 지속시간에 대한 영향을 검토한 결과 벽체변위 및 수평토압에 큰 영향을 미치지 않는 것으로 검토되었다. 한편, 벽체에 작용하는 수평토압은 동결-융해 작용에 의한 영향을 거의 받지 않는 것으로 검토되어 결국 동결-융해로 인한 벽체 변위 증가 현상은 토압 증가에 그 원인을 찾기 보다는 동결-융해 현상으로 인한 재료적 열화 현상에 그 원인을 찾아야 할 것으로 검토되었다.
https://doi.org/10.7843/kgs.2013.29.1.81 인용 PDF KSCI

기온 자료와 에너지수지 방법을 이용한 지역 기준 증발산량 상세화 (Detailing of regional evapotranspiration using temperature data and energy balance method)

강신욱;유완식;김경필;이용신
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2023년도 학술발표회
- /
- pp.118-118
- /
- 2023
물순환 과정의 구성요소 중 하나인 증발산(증발과 증산)은 각종 수자원시설물의 운영관리, 수자원계획 수립, 농업용 시설의 개발 및 운영관리 등에 필요한 매우 중요한 요소이다. 한편, 기후변화 등으로 '14~'19년 장기간 가뭄, '17년 가뭄상황에서도 태풍 '차바'에 의한 국지적 홍수, '20년 역대 최장기간 장마에 의한 대규모 홍수, '22년 태풍 '힌남노' 이후 남부지역 극심한 가뭄 등 가뭄과 홍수가 반복되어 물관리 여건이 매우 어려운 상황이다. 이러한 홍수/가뭄에 효과적으로 대응하기 위해 강우-유출 모형을 사용한다. 신뢰적인 예측결과를 얻기 위해서는 상세하고 정밀한 증발산량 추정이 필요하다. Penman-Monteith(PM) 기법으로 기준 증발산량을 산정하기 위해서는 최고·최저기온, 이슬점온도, 풍속, 일조시간 등의 기상자료가 필요하다. 이러한 자료는 전국 95개 ASOS 지점에만 얻을 수 있다. 계산된 95개 지점의 기준 증발산량은 티센망 등 방법으로 공간평균하여 활용한다. 95개 지점 자료만으로는 지역적 기상 특성을 반영하여 기준 증발산량을 산정하는데 한계가 있으며, 결국 강우-유출분석의 신뢰도 저하로 귀결된다. 본 연구는 기상청 ASOS 지점 외 AWS 590개 지점을 추가하여 기준 증발산량을 산정하여 공간적으로 상세화하였다. ASOS 지점들에 대해 PM 기법과 Hargreaves(HS) 기법으로 22년간의 일단위 기준 증발산량을 각각 계산하였다. 이들의 상관계수는 평균 0.85로 매우 높아, HS 기법으로 산정된 AWS 지점 결과의 추가사용이 적정하였다. 기온만을 사용하는 HS 기법, PM과 HS의 상관성 및 풍속을 반영한 2가지 보정 HS 기법으로 기준 증발산량을 계산하여 비교·분석하였다. 보정된 HS의 결과가 기존 HS 기법에 비해 오차가 적고, 자료의 편향성이 줄어드는 등 더 좋은 결과를 나타내었다. 따라서, 각종 수문분석에 보정 HS 기법을 AWS 지점에 확대·적용하고, ASOS 관측소의 PM 기법과 병행해 상세화하여 활용하면 수문분석의 신뢰성을 더욱 높일 수 있을 것이다.
PDF

분류기법을 이용한 예측 시스템 설계 (Design of Prediction System based on Classification Method)

김대진;이준욱;류근호
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
- /
- pp.154-156
- /
- 2002
정보화시대에 들어서면서 나날이 급증하는 데이터에 대한 재가용성을 위한 많은 연구가 이루어지고 있다 이러한 연구들은 의사결정지원, 예측, 추정 등의 분야에서 적용되고 있으나, 실생활에 활발히 적용되기까지 앞으로 많은 연구 및 개발이 요구된다. 이 논문에서는 수집된 데이터로부터 패턴을 추출하여 예측결과를 제공할 수 있는 시스템 모델과 모델에 적합한 점진적 규칙갱신 알고리즘을 제안하였다. 제안하는 예측 모델의 특징은 새로 입력되는 정보에 대한 반복 학습시 수치데이터에 대한 평균근사치 할당방법을 적용하여 규칙갱신을 용이하게 하였으며 각 클래스의 수치데이터에 대한 분류를 용이하도록 하였다.
PDF

첨예정점의 측지거리 평균군집화를 이용한 메쉬 분할 (Mesh Segmentation With Geodesic Means Clustering of Sharp Vertices)

박영진;박찬;이위;하종성;유관희
- 한국콘텐츠학회논문지
- /
- 제8권5호
- /
- pp.94-103
- /
- 2008
본 논문에서는 주어진 3차원 메쉬의 분할에 $\kappa$-평균군집화 기법을 적용한다. 국부적인 최적의 수렴을 피하고 계산시간을 빠르게 하기 위하여 먼저 주어진 메쉬에 대한 첨예정점들을 인지과학적 측면에서 각각 국부적 전역적 기하 특성을 반영하는 곡률과 볼록성을 분석하여 추출한다. 다음에 추출된 첨예정점들은 그들간의 유클리디언 거리대신 측지거리에 기반한 $\kappa$-평균군집화 기법의 반복 수렴으로 $\kappa$ 개의 군집으로 분할된다. $\kappa$-평균군집화의 효과성에 매우 중요한 요인은 적절한 $\kappa$의 초기값을 부여하는 것이다. 따라서 본 논문에서는 $\kappa$의 초기값으로 합리적인 군집 개수를 자동으로 계산한다. 최종적으로 첨예정점들에 속하지 않는 메쉬의 나머지 정점들은 측지거리로 가장 가까이 존재하는 $\kappa$개의 군집에 병합함으로써 메쉬분할이 완성된다.
https://doi.org/10.5392/JKCA.2008.8.5.094 인용 PDF

빈발 항목의 탐색 시간을 단축하기 위한 알고리즘 (An Algorithm for reducing the search time of Frequent Items)

윤소영;윤성대
- 한국정보통신학회논문지
- /
- 제15권1호
- /
- pp.147-156
- /
- 2011
최근 정보시스템의 활용도가 높아짐에 따라, 많은 데이터를 이용하여 필요한 상품을 빠르게 추출하는 방법들에 대한 연구가 활발히 이루어지고 있다. 숨겨진 패턴을 탐색하는 연관 규칙 탐색 기법들이 많은 관심을 받고 있으며, Apriroi 알고리즘은 대표적인 기법이다. 그러나 Apriori 알고리즘은 반복적인 스캔으로 인한 탐색시간 증가 문제를 가지고 있다. 본 논문에서는 빈발항목의 탐색시간을 단축하기 위한 알고리즘을 제안한다. 제안한 알고리즘은 트랜잭션 데이터베이스를 이용하여 매트릭스를 생성하고 매트릭스에서 트랜잭션들의 평균 항목 개수와 정의한 최소 지지도를 사용하여 빈발 항목을 탐색한다. 트랜잭션의 평균 항목 개수는 트랜잭션의 수를 줄이는데 사용되고 최소 지지도는 항목을 줄이는데 사용된다. 제안한 알고리즘의 성능 평가는 기존 알고리즘과의 탐색시간 비교와 정확도 비교로 이루어진다. 실험 결과는 제안한 알고리즘이 기존의 Apriori와 매트릭스 알고리즘보다 최종 빈발 항목의 추출에서 빠르고 효율적으로 탐색이 이루어지는 것을 확인하였다.
https://doi.org/10.6109/jkiice.2011.15.1.147 인용 PDF KSCI

Transformer를 이용한 유해남조 발생 예측 모델 구축 (Building of cyanobacteria forecasting model using transformer)

이한규;김진휘;변서현;신재기;박용은
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2023년도 학술발표회
- /
- pp.515-515
- /
- 2023
팔당호는 북한강과 남한강이 합류하여 생성된 호소로 수도인 서울과 수도권인 경기도 동부지역의 물 공급을 담당하는 중요한 상수원이다. 이러한 팔당호에서 유해남조 발생은 상수원수 활용과 직접적으로 연관되어 있어 신속하고 정확한 관리 및 예측이 필요하다. 본 연구에서는 안전한 상수원 활용을 위해, 딥러닝 기법을 이용하여 유해남조 사전 예측 모델을 구축하고자 하였다. 모델 입력 변수는 2012년부터 2021년까지 10년 동안의 주간 팔당호 수질(수온, DO, BOD, COD, Chl-a, TN, TP, pH, 전기전도도, TDN, NH4N, NO3N, TDP, PO4P, 부유물질)과 수문(유입량, 총방류량), 기상 정보(평균기온, 최저기온, 최고기온, 일 강수량, 평균풍속, 평균 상대습도, 합계일조량), 그리고 북한강과 남한강 유입지점의 남조 세포 수를 사용하였다. 모델 출력 변수는 수질, 수문, 기상 요인으로 인한 남조의 성장 발현 시기를 고려하여 1주 후의 댐앞 남조 세포수를 사용하였다. 사용한 딥러닝 기법은 최근 주목받고 있는 Temporal Fusion Transformer (TFT)를 사용하였다. 모델 훈련용 데이터와 테스트용 데이터는 각각 8:2의 비율로 나누었으며, 검증용 데이터는 훈련용 데이터 내에서 훈련 데이터와 검증 데이터를 6:4 비율로 분배하였다. Lookback은 5로 설정하였고, 이는 주단위 데이터로 구성된 데이터세트의 특성을 반영한 것이다. 모델의 성능은 실측값과 예측값을 토대로 R-square와 Root Mean Squared Error (RMSE)를 계산하여 평가하였다. 모델학습은 총 154번 반복 진행되었으며, 이 중 성능이 가장 준수한 시점은 54번째 반복 시점으로 훈련손실 대비 검증손실이 가장 양호한 값을 나타냈다(훈련손실:0.443, 검증손실 0.380). R-square는 훈련단계에서 0.681, 검증단계에서 0.654였고, 테스트 단계에서 0.606으로 산출되었다. RMSE는 훈련단계에서 0.614(㎍/L), 검증단계에서 0.617(㎍/L), 테스트 단계에서 0.773(㎍/L)였다. 모델에 사용한 데이터세트가 주간 데이터라는 특성을 고려하면, 소규모 데이터를 사용하였음에도 본 연구에서 구축한 모델의 성능은 양호하다고 평가할 수 있다. 향후 연구에서 데이터세트를 보강하고 모델을 업데이트한다면, 모델의 성능을 더욱더 개선할 수 있을 것으로 기대된다.
PDF

시각적 평균 표상의 신경기제 (Neural correlates of visual mean representation)

정상철;신길호;조신호
- 인지과학
- /
- 제19권1호
- /
- pp.75-88
- /
- 2008
시각 장면은 중복적인 정보가 많이 포함되어 있다. 우리의 시각체계는 다양하고 중복적인 정보를 처리하기 위해 뇌 용적을 늘이기보다는 들어오는 외부 정보를 요약한다. 유사한 형태의 다양한 정보가 시각체계에 주어지면 시각체계는 정보의 통계적 특성을 추출해 낸다. 이런 통계적 표상의 대표적 형태가 바로 평균 표상이다. 평균 표상의 한 예로 시각 체계에서 계산해 내는 유사한 여러 크기들의 평균 크기를 들 수 있다. 평균 표상은 빠르고 정확하며 비교적 오랜 시간 지속되는 표상이고 평균 표상의 처리과정 또한 병렬적인 처리과정이다. 하지만 지금까지의 통계 표상에 관한 연구는 행동측정방법에 의한 연구였다. 따라서 본 연구는 기능적 자기 공명 영상 기법을 사용하여 통계 표상에 관한 신경기제를 찾고자 하였다. 사전 연구 결과들에 따르면 특정 자극을 연속하여 제시하였을 때 특정 자극을 담당하는 영역에서 자기 공명 영상 신호가 감소함을 알 수 있다. 본 연구에서는 이 반복 감소 현상을 사용하여 원들의 평균이 동일한 자극을 제시하였을 때 우측 후두 영역에서 유의미하게 자기 공명 영상 신호가 감소하는 것을 발견하였다. 이것은 우측 후두 영역이 시각자극에 대한 평균 표상을 처리하는 영역일 수 있음을 시사한다.
PDF

채널간간섭 자기소거법이 적용된 직교 주파수분할다중화의 첨두전력 대 평균전력비 (Peak-to-Average Power Ratio of Orthogonal Frequency Division Multiplexing with ICI Self-Cancellation)

강석근
- 대한전자공학회논문지TC
- /
- 제42권1호`
- /
- pp.1-8
- /
- 2005
본 논문에서는 채널간간섭 자기소거를 위한 부대역 부호화기법에 따른 직교 주파수분할다중화의 첨두전력 대 평균전력비가 분석된다. 인접부대역에 대척신호를 할당하는 기존 상관부호화의 경우 전송신호열에서 형상성분이 발생됨을 이론적ㆍ실험적으로 검증한다. 이로 인하여 심볼의 중간부분과 가장자리부분에서의 신호전력은 서로 다른 가중치의 영향을 받게 되며, 이는 증가된 첨두전력 대 평균전력비를 초래한다. 이와 같은 문제점을 극복하기 위하여 본 논문에서는 새로운 간단한 부대역 부호화기법이 제시된다. 여기서는 신호쌍의 위상차가 매 신호마다 변화되도록 할당함으로써 신호의 부분적인 반복성으로 인한 형상성분을 제거한다. 그 결과, 새로운 부대역 부호화기법이 적용된 시스템은 기존의 시스템보다 2～3 dB 적은 첨두전력 대 평균전력비를 가지면서도 일반적인 직교 주파수분할다중화에 비하여 현저히 큰 반송파대 간섭비를 유지한다.
PDF KSCI

시뮬레이션 출력의 안정상태 온라인 결정에 관한 연구 (On-Line Determination Steady State in Simulation Output)

이영해;정창식;경규형
- 한국시뮬레이션학회:학술대회논문집
- /
- 한국시뮬레이션학회 1996년도 춘계학술대회
- /
- pp.1-3
- /
- 1996
시뮬레이션 기법을 이용한 시스템의 분석에 있어서 실험의 자동화는 현재 많은 연구와 개발이 진행 중인 분야이다. 컴퓨터와 정보통신 시스템에 대한 시뮬레이션의 예를 들어 보면, 수많은 모델을 대한 시뮬레이션을 수행할 경우 자동화된 실험의 제어가 요구되고 있다. 시뮬레이션 수행회수, 수행길이, 데이터 수집방법 등과 관련하여 시뮬레이션 실험방법이 자동화가 되지 않으면, 시뮬레이션 실험에 필요한 시간과 인적 자원이 상당히 커지게 되며 출력데이터에 대한 분석에 있어서도 어려움이 따르게 된다. 시뮬레이션 실험방법을 자동화하면서 효율적인 시뮬레이션 출력분석을 위해서는 시뮬레이션을 수행하는 경우에 항상 발생하는 초기편의 (initial bias)를 제거하는 문제가 선결되어야 한다. 시뮬레이션 출력분석에 사용되는 데이터들이 초기편의를 반영하지 않는 안정상태에서 수집된 것이어야만 실제 시스템에 대한 올바른 해석이 가능하다. 실제로 시뮬레이션 출력분석과 관련하여 가장 중요하면서도 어려운 문제는 시뮬레이션의 출력데이터가 이루는 추계적 과정 (stochastic process)의 안정상태 평균과 이 평균에 대한 신뢰구간(confidence interval: c. i.)을 구하는 것이다. 한 신뢰구간에 포함되어 있는 정보는 의사결정자에게 얼마나 정확하게 평균을 추정할 구 있는지 알려 준다. 그러나, 신뢰구간을 구성하는 일은 하나의 시뮬레이션으로부터 얻어진 출력데이터가 일반적으로 비정체상태(nonstationary)이고 자동상관(autocorrelated)되어 있기 때문에, 전통적인 통계적인 기법을 직접적으로 이용할 수 없다. 이러한 문제를 해결하기 위해 시뮬레이션 출력데이터 분석기법이 사용된다.본 논문에서는 초기편의를 제거하기 위해서 필요한 출력데이터의 제거시점을 찾는 새로운 기법으로, 유클리드 거리(Euclidean distance: ED)를 이용한 방법과 현재 패턴 분류(pattern classification) 문제에 널리 사용 중인 역전파 신경망(backpropagation neural networks: BNN) 알고리듬을 이용하는 방법을 제시한다. 이 기법들은 대다수의 기존의 기법과는 달리 시험수행(pilot run)이 필요 없으며, 시뮬레이션의 단일수행(single run) 중에 제거시점을 결정할 수 있다. 제거시점과 관련된 기존 연구는 다음과 같다. 콘웨이방법은 현재의 데이터가 이후 데이터의 최대값이나 최소값이 아니면 이 데이터를 제거시점으로 결정하는데, 알고기듬 구조상 온라인으로 제거시점 결정이 불가능하다. 콘웨이방법이 알고리듬의 성격상 온라인이 불가능한 반면, 수정콘웨이방법 (Modified Conway Rule: MCR)은 현재의 데이터가 이전 데이터와 비교했을 때 최대값이나 최소값이 아닌 경우 현재의 데이터를 제거시점으로 결정하기 때문에 온라인이 가능하다. 평균교차방법(Crossings-of-the-Mean Rule: CMR)은 누적평균을 이용하면서 이 평균을 중심으로 관측치가 위에서 아래로, 또는 아래서 위로 교차하는 회수로 결정한다. 이 기법을 사용하려면 교차회수를 결정해야 하는데, 일반적으로 결정된 교차회수가 시스템에 상관없이 일반적으로 적용가능하지 않다는 문제점이 있다. 누적평균방법(Cumulative-Mean Rule: CMR2)은 여러 번의 시험수행을 통해서 얻어진 출력데이터에 대한 총누적평균(grand cumulative mean)을 그래프로 그린 다음, 안정상태인 점을 육안으로 결정한다. 이 방법은 여러 번의 시뮬레이션을 수행에서 얻어진 데이터들의 평균들에 대한 누적평균을 사용하기 매문에 온라인 제거시점 결정이 불가능하며, 작업자가 그래프를 보고 임의로 결정해야 하는 단점이 있다. Welch방법(Welch's Method: WM)은 브라운 브리지(Brownian bridge) 통계량()을 사용하는데, n이 무한에 가까워질 때, 이 브라운 브리지 분포(Brownian bridge distribution)에 수렴하는 성질을 이용한다. 시뮬레이션 출력데이터를 가지고 배치를 구성한 후 하나의 배치를 표본으로 사용한다. 이 기법은 알고리듬이 복잡하고, 값을 추정해야 하는 단점이 있다. Law-Kelton방법(Law-Kelton's Method: LKM)은 회귀 (regression)이론에 기초하는데, 시뮬레이션이 종료된 후 누적평균데이터에 대해서 회귀직선을 적합(fitting)시킨다. 회귀직선의 기울기가 0이라는 귀무가설이 채택되면 그 시점을 제거시점으로 결정한다. 일단 시뮬레이션이 종료된 다음, 데이터가 모아진 순서의 반대 순서로 데이터를 이용하기 때문에 온라인이 불가능하다. Welch절차(Welch's Procedure: WP)는 5회이상의 시뮬레이션수행을 통해 수집한 데이터의 이동평균을 이용해서 시각적으로 제거시점을 결정해야 하며, 반복제거방법을 사용해야 하기 때문에 온라인 제거시점의 결정이 불가능하다. 또한, 한번에 이동할 데이터의 크기(window size)를 결정해야 한다. 지금까지 알아 본 것처럼, 기존의 방법들은 시뮬레이션의 단일 수행 중의 온라인 제거시점 결정의 관점에서는 미약한 면이 있다. 또한, 현재의 시뮬레이션 상용소프트웨어는 작업자로 하여금 제거시점을 임의로 결정하도록 하기 때문에, 실험중인 시스템에 대해서 정확하고도 정량적으로 제거시점을 결정할 수 없게 되어 있다. 사용자가 임의로 제거시점을 결정하게 되면, 초기편의 문제를 효과적으로 해결하기 어려울 뿐만 아니라, 필요 이상으로 너무 많은 양을 제거하거나 초기편의를 해결하지 못할 만큼 너무 적은 양을 제거할 가능성이 커지게 된다. 또한, 기존의 방법들의 대부분은 제거시점을 찾기 위해서 시험수행이 필요하다. 즉, 안정상태 시점만을 찾기 위한 시뮬레이션 수행이 필요하며, 이렇게 사용된 시뮬레이션은 출력분석에 사용되지 않기 때문에 시간적인 손실이 크게 된다.
PDF

검색결과 160건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)