• Title/Summary/Keyword: 의미 거리

Search Result 676, Processing Time 0.042 seconds

A Korean Homonym Disambiguation Model Based on Statistics Using Weights (가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델)

  • 김준수;최호섭;옥철영
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.11
    • /
    • pp.1112-1123
    • /
    • 2003
  • WSD(word sense disambiguation) is one of the most difficult problems in Korean information processing. The Bayesian model that used semantic information, extracted from definition corpus(1 million POS-tagged eojeol, Korean dictionary definitions), resulted in accuracy of 72.08% (nouns 78.12%, verbs 62.45%). This paper proposes the statistical WSD model using NPH(New Prior Probability of Homonym sense) and distance weights. We select 46 homonyms(30 nouns, 16 verbs) occurred high frequency in definition corpus, and then we experiment the model on 47,977 contexts from ‘21C Sejong Corpus’(3.5 million POS-tagged eojeol). The WSD model using NPH improves on accuracy to average 1.70% and the one using NPH and distance weights improves to 2.01%.

A Spatial Statistical Approach to Migration Studies: Exploring the Spatial Heterogeneity in Place-Specific Distance Parameters (인구이동 연구에 대한 공간통계학적 접근: 장소특수적 거리 패러미터의 추출과 공간적 패턴 분석)

  • Lee, Sang-Il
    • Journal of the Korean association of regional geographers
    • /
    • v.7 no.3
    • /
    • pp.107-120
    • /
    • 2001
  • This study is concerned with providing a reliable procedure of calibrating a set of places specific distance parameters and with applying it to U.S. inter-State migration flows between 1985 and 1900. It attempts to conform to recent advances in quantitative geography that are characterized by an integration of ESDA(exploratory spatial data analysis) and local statistics. ESDA aims to detect the spatial clustering and heterogeneity by visualizing and exploring spatial patterns. A local statistic is defined as a statistically processed value given to each location as opposed to a global statistic that only captures an average trend across a whole study region. Whereas a global distance parameter estimates an averaged level of the friction of distance, place-specific distance parameters calibrate spatially varying effects of distance. It is presented that a poisson regression with an adequately specified design matrix yields a set of either origin-or destination-specific distance parameters. A case study demonstrates that the proposed model is a reliable device of measuring a spatial dimension of migration, and that place-specific distance parameters are spatially heterogeneous as well as spatially clustered.

  • PDF

A Comparative Analysis of Linearity and Range of Gravity and Magnetic Data Using Variogram (베리오그램을 이용한 중력과 자력 자료의 선형성 및 상관거리 비교 분석)

  • Park, Gye-soon;Park, No-Wook
    • Journal of the Korean earth science society
    • /
    • v.31 no.2
    • /
    • pp.119-128
    • /
    • 2010
  • To make reliable interpretations on the sparse spatial data, the spatial distribution characteristics that are inevitable for spatial estimation should be properly analyzed. Variograms have been widely used for obtaining the spatial characteristics inherent to data in spatial estimation problems. But their applications were limited as the basic information for further data estimation. Therefore, the additional analysis of the meaning of variograms is required for more reliable data processing and interpretations. In this paper, we investigated the proper meaning of variogram values and the specific features of distributions which can be obtained through variogram analysis. Variograms can provide the information on both linearity and the strength changes of interrelationships between the data sets according to the direction and lag distance. First, sill and range values, which are main parameters of variograms, were analyzed. Then a similarity range using spatial auto-correlation values was introduced to verify the applicability of linearity analysis through the comparative study of spatial distribution features of gravity and magnetic data collected in Hwasan caldera. Through these analyses, we were able to identify the dissimilar patterns of gravity and magnetic data that became apparent according to the distribution and variation ranges of the data sets. It is inferred that the gravity and magnetic anomalous bodies are extended to the ground because linearity direction of gravity and magnetic data appear similarly with linearity derection of topography in Hwasan caldera.

Optimal Sensor Placement method for Construction of Ubiquitous Sensing Infra (유비쿼터스 센싱 인프라 구축을 위한 최적센서 배치 방법)

  • Kim, Jung-Eun;Yoon, Man-Ki;Han, Jung-Hee;Lee, Chang-Gun;Ha, Eun-Yong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06d
    • /
    • pp.313-317
    • /
    • 2008
  • 유비쿼터스 환경에 대한 관심이 증폭됨에 따라, 센서는 다양한 어플리케이션들에서 점점 더 많이 사용되고 있다. 이러한 센서 시스템에서, 최소 개의 센서를 가지고 대상 공간이 복수 개의 센서에 의해 완전히 센싱되게 하기 위해서는, 센서를 어디에 배치하느냐가 중요한 문제이다. 또한 복수 개의 센서에 의해 센싱된 데이터로부터 의미 있는 정보를 추출하기 위해서는 센서 서로 간의 거리가 너무 가까워서는 안 된다. (최소거리 요건). 이를 위하여 우리는 TRE-based approach 라고 하는, 최소거리 요건을 만족하며 3-coverage 문제를 해결하는 방법을 제안하며, 이를 기반으로 3-coverage 문제를 3 차원으로 확장시킬 때 가능한 센싱 coverage 모델과 그 확장 가능성에 대해 논의한다.

  • PDF

Most Appropriate Image Selection method for Color Extraction in Immersive modeling (실감 모델링을 위한 색 추출 기법에서 적합한 이미지 선정 방법 연구)

  • Park, Joung-Wook;Lee, Kwan-H.
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.44-49
    • /
    • 2007
  • 반짝이는 특성의 물체에 대해 이미지를 기반으로 색을 추출하는 경우 반짝이는 특성을 포함하면서 내재되어 있는 색 특성을 표현하기 위해 색 곡선(color line)을 이용한다. 이 경우 추출하려는 색이 왜곡되지 않은 가장 적합한 이미지를 선정하는 방법이 필요하다. 이를 위해서 실감모델링을 위해 색 곡선을 기반으로 색을 추출하는 방법을 제시하고 제시된 방법을 위해 색을 추출하기 가장 적합한 이미지를 선정하는 기준을 색포화율(color saturation ratio)을 통해 제안한다. 색포화율이란 색을 구성하는 요소 중에서 최소한 하나 이상의 색이 포화된 픽셀들을 최대 색거리를 가진 픽셀들로 간주하여 계산된 색거리의 총합에 대해 최소한 하나 이상의 색이 포화된 픽셀들의 색거리 총합의 비율를 의미한다. 이상적으로 이 비율이 최소가 되면 하이라이트를 제외한 어떤 픽셀도 포화되지 않기 때문에 반짝이는 특성을 가진 물체의 색을 추출하기 위해 촬영된 이미지는 하이라이트를 제외한 모든 색이 왜곡되지 않은 가장 적합한 이미지가 생성된다. 또한, 이렇게 선정된 이미지에서 추출된 색의 효율성을 보이기 위해 색 공간과 이미지 상에서 다양한 형태의 응용 결과를 제시하였다.

  • PDF

Comparison of Homograph Meaning Representation according to BERT's layers (BERT 레이어에 따른 동형이의어 의미 표현 비교)

  • Kang, Il Min;Choi, Yong-Seok;Lee, Kong Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.161-164
    • /
    • 2019
  • 본 논문은 BERT 모델을 이용하여 동형이의어의 단어 표현(Word Representation) 차이에 대한 실험을 한다. BERT 모델은 Transformer 모델의 인코더 부분을 사용하여 양방향을 고려한 단어 예측과 문장 수준의 이해를 얻을 수 있는 모델이다. 실험은 동형이의어에 해당되는 단어의 임베딩으로 군집화를 수행하고 이를 Purity와 NMI 점수로 계산하였다. 또한 각 단어 임베딩 사이를 코사인거리(Cosine Distance)로 계산하고 t-SNE를 통해 계층에 따른 변화를 시각화하였다. 군집된 결과는 모델의 중간 계층에서 점수가 가장 높았으며, 코사인거리는 8계층까지는 증가하고 11계층에서 급격히 값이 변하는 것을 확인할 수 있었다.

  • PDF

Graph Learning System for Analyzing Bias among News Using Keyword Distance Model (주제어 문장거리를 이용한 뉴스 편향성 분석 그래프 학습)

  • Cho Chanwoo;Cho Chanhyung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.533-538
    • /
    • 2023
  • 문서에서 저자의 의도와 주제, 그 안에 포함된 감성을 분석하는 것은 자연어 연구의 핵심적인 주제이다. 이와 유사하게 특정 글에 포함된 정치적 문화적 편향을 분석하는 것 역시 매우 의미 있는 연구주제이다. 우리는 최근 발생한 한 사건에 대하여 여러 신문사와 해당 신문사에서 생산한 기사를 중심으로 해당 글의 정치적 편향을 정량화 하는 방법을 제시한다. 그 방법은 선택된 주제어들의 문장 공간에서의 거리를 중심으로 그래프를 생성하고, 생성된 그래프의 기계학습을 통하여 편향과 특징을 분석하였다. 그리고 그 그래프들의 시간적 변화를 추적하여 특정 신문사에서 특정 사건에 대한 입장이 시간적으로 어떻게 변화하였는지를 동적으로 보여주는 그래프 애니메이션 시스템을 개발하였다. 실험을 위하여 최근 이슈에 대하여 12개의 신문사에서 약 2000여 개의 기사를 수집하였다. 그 결과, 약 82%의 정확도로 일반적으로 알려진 정치적 편향을 예측할 수 있었다. 또한, 학습 데이터에 쓰이지 않은 신문기사를 활용하여도 같은 정도의 정확도를 보임을 알 수 있었다. 우리는 이를 통하여 신문기사에서의 정치적 편향은 작성자나 신문사의 특성이 아니라 주제어들의 문장 공간에서의 거리 관계로 특성화할 수 있음을 보였다. 할 수 있다.

  • PDF

Characteristics of Dual Transverse Injection in Supersonic Flow Fields I-Mixing Characteristics (초음속 유동장 내 이중 수직분사의 특성에 관한 연구 I-혼합특성)

  • Shin, Hun-Bum;Lee, Sang-Hyeon
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.30 no.6
    • /
    • pp.53-60
    • /
    • 2002
  • Based on the analyses of the single transverse injection in supersonic flow fields, the mixing characteristics of dual transverse injection of hydrogen in supersonic air flow are studied with computational methods. Three-dimensional Navier -Stokes and the k-$\omega$ SST turbulence model were used. A parametric study is conducted with the variation of the distance between two injectors. The flow patterns and the mixing characteristics of two injection flows are very different from each other, and the flow patterns and the mixing characteristics of the rear injection flow are strongly influenced by those of the first injection flow. The increase of the distance between two injectors up to a specific distance results in the increase of mixing rate and penetration of fuel. However, the increase of the distance over the specific distance results in the decrease of mixing rate and penetration of fuel. From the results it can be stated that there exists a distance between two injectors for optimum mixing characteristics.

시민을 위한 지적 인프라

  • Choe, Bo-Yun
    • 주택과사람들
    • /
    • s.210
    • /
    • pp.82-85
    • /
    • 2007
  • 당신에게도 도서관은 어떤 의미인가? 당신의 기억 속 그곳은 입시나 취업준비의 중압감을 안고 공부했던 곳, 혹은 보고 싶은 책은 항상 대출 중인 휑한 곳이 아니었던가. 현재 상황도 별반 다르지는 않다. 작은 도서관 운동등 변화를 시도하는 움직임이 늘곤 있지만, 아직까지 우리의 공공 도서관은 멀고, 협소하고, 자료도 별로 없는 초라한 형색이다. 하지만 도서관의 궁핍한 처지를 탓하기 전에 자신에게 한번 물어보라. 바쁜 일상과 먼 거리를 핑계 삼아 '도서관은 나와 상관없는 곳'으로 치부하지는 않았는지 말이다.

  • PDF

치매

  • KOREA ASSOCIATION OF HEALTH PROMOTION
    • 건강소식
    • /
    • v.29 no.4 s.317
    • /
    • pp.6-9
    • /
    • 2005
  • 치매라는 말은 Dement라는 라틴어에서 유래된 것으로써 '정상적인 마음과는 거리가 멀어진것', '정신이 없어진 것'이라는 의미를 지니고 있다. 치매는 나이가 들어감에 따라 정상적으로 발달한 뇌가 후천적인 외상이나 질병 등 외부적인 요인에 의해 손상되거나 파괴되어 언어ㆍ학습ㆍ지능 등에 대한 전반적인 인지기능과 고등정신기능이 비정상적으로 감퇴되는 복합적인 임상증후군을 포괄적으로 이르는 것을 말한다.

  • PDF