• 제목/요약/키워드: dictionary construction

검색결과 114건 처리시간 0.03초

공동주택 하자소송 균열쟁점을 통한 전문감정인 제도 개선방안 (Improvement Plan on Appraisal System of Defect Disputes about Cracks on Apartment Buildings)

  • 김법수;박준모;김옥규;서덕석
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2011년도 춘계 학술논문 발표대회 1부
    • /
    • pp.185-186
    • /
    • 2011
  • The latest domestic construction sector is receiving economic damage because of defect litigation. The Concrete Crack among them has the largest component in expense of apartment house defect. Also, contradictory suggestion of appraiser is problem. To improve these problem, need objective plan that people concerned can recognize about decision sequence. Therefore, in this study, compared general defect investigation and defect decision of appraiser taking advantage of Data Dictionary analysis method. Also, deduced current problem and amelioration plan.

  • PDF

Construction of Local Document Management System based on Associative Search

  • Kasagi, Yoshimasa;Yamaguchi, Toru;Takama, Yasufumi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.146-149
    • /
    • 2003
  • As the information that can collect from the web to local database is increasing, we propose a system that can suggest related local documents when new document arrives. We also propose for constructing an association dictionary using web search engines for similarity calculation. The prototype system is also developed, which is described in detail.

  • PDF

한국어 개념사전의 구축에 관한 연구 (A Study on the Construction of a Korean Concept Dictionary)

  • 김수정;김태수
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.239-242
    • /
    • 1998
  • 개념 정보를 제공하는 어휘 데이터베이스로 WordNet, CYC, EDR등이 출현하였다. 본 연구는 WordNet의 개념 기술 방식에 따라 한국어 개념 사전을 구축하기 위한 것이다 우선 개념을 분류할 적절한 분류 체계를 설정하고, 연세 말뭉치에서 빈도수가 높은 상위 300개 명사를 추출하여 사전의 뜻풀이에 나타난 명사와 연관관계로 표시된 명사를 함께 제시함으로써 개념을 표현하였다. 이러한 한국어 개념 사전은 의미모호성을 해소하는데 기여할 수 있을 것이다.

  • PDF

의미사전 활용을 위한 EDI 브리지의 구축 (Construction of EDI Bridges to Utilize Semantic Dictionary)

  • 정용규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.145-148
    • /
    • 2007
  • 본 연구에서는 KIEC 라이브러리와 UBL 라이브러리 간에 의미를 기반으로 한 상호운용의 결과물과 연계가 되도록 하며 이를 확장하여 EDIFACT문서를 대상으로 XML-EDI 간의 상호운용이 가능하게 한다. 이를 위해서 KEDIFACT 표준전자문서에 대해 구성항목을 분석하고, 사용되고 있는 문서를 중심으로 의미를 기반으로 한 항목정의를 하였다. 관련된 국내 외 표준을 준용하여, 구축한 KEDIFACT 의미사전을 기반으로 기존에 구축되어있는 XML(KIEC, UBL) 의미사전과 의미기반의 비교 분석 작업을 통하여 EDI-XML 라이브러리 간 매핑이 가능하도록 브릿지를 구축하여 상호운용 기반을 마련하였다.

  • PDF

한국어 위키피디아를 이용한 분류체계 생성과 개체명 사전 자동 구축 (Automatic Construction of Class Hierarchies and Named Entity Dictionaries using Korean Wikipedia)

  • 배상준;고영중
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.492-496
    • /
    • 2010
  • 위키피디아는 개방형 백과사전으로서 수많은 편집자들에 의해 작성되기 때문에 빠른 시간에 방대한 양의 정보가 축적되고 있으며, 축적되는 정보의 신뢰성 또한 매우 높다. 본 논문에서는 이러한 장점을 가진 위키피디아의 여러 가지 세부정보를 이용하여 한국어 개체명 사전을 자동으로 구축하는 방법을 제안한다. 먼저 위키피디아의 각 엔트리(entry)의 분류정보를 사용하여 분류체계(class hierarchy)를 생성한다. 생성된 분류체계에 위키피디아 엔트리를 자동으로 매핑(mapping)시킨 다음, 분류체계에서 최상위 계층의 불확실성(entropy)을 계산한다. 마지막으로, 임계값 이상의 불확실성을 가지는 분류체계를 제거함으로써 정확률이 높은 개체명 사전을 구축한다. 본 논문에서 제안하는 방법으로 실험을 한 결과 최고 81.12%(83.94%:정확률,78.48%:재현율)의 F1-measure의 성능을 보였다.

근대 적벽돌 생산사에 관한 연구 (A Study on the Formation of the 'Jeokbyeokdol (Red brick)' in Modern Korea)

  • 조홍석;김정동
    • 건축역사연구
    • /
    • 제19권6호
    • /
    • pp.99-120
    • /
    • 2010
  • According to it, a final goal of this study sets up 'Renovation of the Red brick architecture' and development of theoretical foundation and substantial conservation about Red brick architecture through historical records must be settled without delay. Firstly, it analyzes related terminology and adjusts brick architecture's history and features for architectural authenticity about Red brick architecture. It would study production and construction process of brick in korea. From analysis of records, brick of traditional meaning is 'Jeondol' and western brick of modern meaning is 'Red brick'. 'Brick' defines a common designation. This study shows definition of words based on documents published until 19th century and a korean language and architecture terms dictionary. In view of this results, the meaning of brick which combines different types extensively uses 'Chu', 'Jeon', 'Byeok' according to the purpose of use and the current of the times. In case of 'Jeon', it uses jointly different types such as '塼', '磚', '甎'. but '塼' is frequently used. Even though these words like 'byeok' used individual or combination types until the late 19th century, there is no use because of japanese terms in japanese colonial. After liberation, it was the term of the traditional brick. Brick is generally used through modern times. In an unabridged Korean language dictionary, it defines this term as orthodox korean '壁乭' and '?乭'. At that time of japanese colonial, 'Yeonwa(煉瓦)' used in combination with brick. Due to influence it, it partly uses until now but it is not in common use. Also, a Korean language dictionary contains transcription of 'Yeonwa' with same definition as 'Byeokdol'. In the other side, it results from translating japanese into Korean. It would make exact definition of 'Yeonwa'.

군집분석을 이용한 양파 감성사전 구축 (Construction of Onion Sentiment Dictionary using Cluster Analysis)

  • 오승원;김민수
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2917-2932
    • /
    • 2018
  • 우리나라 식생활에 밀접한 관련을 가지고 있는 채소인 양파의 수급불균형 해결을 위한 생산량 예측 모형 개발의 노력이 많은 연구를 통해 이뤄지고 있다. 하지만 양파의 수확기와 저장 가능성을 고려해 봤을 때 생산량 예측만으로는 수급불균형 해결이 어렵다. 따라서 본 논문에서는 양파의 생산량 정보와 가격의 다양한 요인이 포함되어 있으며 일상에서 쉽게 접할 수 있는 인터넷 기사를 이용하여 가격 예측을 위한 감성사전을 구축하고자 한다. 양파 기사는 2012년부터 2016년까지의 데이터를 사용하였고 도매시장 가격을 통한 문서구분을 통해 4가지 TF-IDF를 비교하여 적합한 TF-IDF를 사용하였다. 분석을 위하여 분할적 군집분석 중 k-means 군집, 밀도기반군집(DBSCAN; density based spatial cluster applications with noise), 가우시안혼합분포군집(GMM; Gaussian mixture model) 군집을 통하여 가격에 대한 긍정/부정 단어를 구분한 결과 GMM 군집이 의미 있는 긍정, 부정, 무정의 3개의 사전으로 구성되었다. 구축된 사전의 합리성을 비교하기 위하여 가격 상승 기사와 가격 하락 기사의 분류에 로지스틱 회귀분석을 적용한 결과 85.7%의 정확도로 구축된 사전의 합리성을 확인할 수 있었다.

상대빈도를 이용한 문법형태소의 인식 방법 (A Method of Function-word Recognition by Relative Frequency)

  • 강승식
    • 인지과학
    • /
    • 제10권2호
    • /
    • pp.11-16
    • /
    • 1999
  • 한글 문서에서 일부 조사와 일부 어미들은 출현 빈도가 높은 반면에 그 외에 조사와 어미는 출현빈도가 낮을 것으로 추측되고 있다. 본 연구에서는 실험을 통해서 이러한 사실을 확인하고 한국어 분석 시스템에서 활용하기 위하여 조사와 어미의 상대적 출현 빈도를 조사하였다. 조사의 상대적 출현 빈도를 조사한 결과, 말 뭉치 분야에 따라 약간의 차이가 있으나 일반적으로 빈도수가 높은 9개의 조사가 전체 조사의 70%를 차지하고 상위 20개, 32개, 69개의 조사가 각각 90%, 95%, 99%를 차지하고 있음을 확인하였다. 어말 어미는 빈도수가 높은 10개의 어말 어미가 전체 어말 어미의 70%를 차지하고 상위 33개, 54개, 117개가 각각 90%, 95%, 99%를 차지하고 있다. 본 논문에서는 조사와 어미의 상대적 출현 빈도에 따라 문법형태소 사전을 구성하는 방법을 제안한다. 조사와 어미의 상대적 출현 빈도는 미등록 어 추정이나 형태론적 중의 성을 해결할 때도 활용된다.

  • PDF

도메인 별 감성분석을 위한 도메인 맞춤형 감성사전 구축 기법 (A Domain Adaptive Sentiment Dictionary Construction Method for Domain Sentiment Analysis)

  • 김다해;조태민;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.15-18
    • /
    • 2015
  • SNS의 확산으로 대중들은 제품, 서비스, 사회적 이슈 등 다양한 도메인에 대하여 자신의 기분이나 의견을 적극적으로 표현하고 있다. 이에 따라 SNS를 분석하여 제품의 수요, TV 시청률, 주가 등의 다양한 현상을 예측하는 데 있어 감성분석을 활용하는 연구가 활발히 진행되고 있다. 감성분석은 각 어휘에 대한 품사, 극성, 감성지수를 규정하고 있는 감성사전을 기반으로 이루어진다. 하지만 동일한 단어라도 도메인에 따라 중요도가 달라지기 때문에 도메인의 특성을 고려한 감성사전을 사용해야 할 필요성이 있다. 따라서 본 연구에서는 다양한 도메인에 대하여 각각의 특성에 맞게 더욱 정확한 감성분석을 할 수 있도록 도메인 맞춤형 감성사전을 구축하는 기법을 제안한다. 도메인 별로 긍 / 부정 평가에 있어 중요한 척도가 되는 단어들을 도메인 감성어휘로 선별하여 목록을 구축하고, 각 감성어휘의 중요도에 따라 도메인 감성지수를 새롭게 정의하였다. 실험 결과, 평가 도메인에 적합한 감성사전이 다른 도메인의 감성사전 및 범용 감성사전보다 우수한 성능을 보였다. 이를 통해 도메인 맞춤형 감성사전 구축기법의 효용성을 확인하였다.

  • PDF

남북 IT용어 사전집 발간을 위한 표준체계 연구 (The Conceptual System on Compiling Operations for the Dictionary of South & North Korea IT Terminology)

  • 최성;김현숙;진용옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1702-1705
    • /
    • 2012
  • North-South Korean information technology(IT) terminologies are going to be gradually changed differently as the time is flowed. In accordance with the age of advanced information science and technology, the IT terminologies should be mutually identified and confirmed on the basis of ISO2382 Korean standardization being set up for the international IT terminologies made by the scholars both Republic of Korea(ROK) and Democratic Peoples' Republic of Korea(DPRK). In the present study, the results of mutual efforts on IT standardization since 1994 has been firstly analyzed systematically for the advanced North-South Korean IT terminology. Secondly, the differences of the IT terminologies used currently in both ROK and DPRK have been also analyzed and classified in the three categories. Thirdly, the current IT terminologies used in both ROK and DPRK have been summarized on the basis of "Encyclopedia of 21 Century Computer Terminology." Fourth, it has been finally set up the construction scheme of conceptual system on compiling operations for the dictionary of North-South Korean IT terminologies.