• 제목/요약/키워드: Morphological part

검색결과 537건 처리시간 0.027초

증권형 크라우드펀딩 투자설명서 형태소분석을 통한 투자자 보호방안에 관한 연구 (A Study on Investor Protection through Morphological Analysis of Equity Crowdfunding Investment Manual)

  • 정주영;박근우
    • 한국IT서비스학회지
    • /
    • 제18권5호
    • /
    • pp.165-182
    • /
    • 2019
  • An equity crowdfunding system of Korea has been introduced since January 25, 2016. The crowdfunding has contributed to remove the funding gap for startups in Korea. In the three years since the introduction of the system, the amount issued has been growing annually 31 percent. In 2018, the general investors who participated in equity crowdfunding, account for 93.8% of the total market size. General investors are a large part of equity crowdfunding. Investors, however, are facing the information asymmetry problems. General investors rely heavily on the investment prospectus provided by startups to obtain the information they need to determine their investment decisions. Under these circumstances, startups have the incentive to provide information that is advantageous to them, and investors are likely to be adversely affected by the investment prospectus. In this study, we collected the novel crowdfunding prospectus dataset: a total of 459 investment prospectus and conducted a morphological analysis. The analysis showed that the more positive the word, the higher the success rate of investors' subscriptions. We also compared projects that were heavily invested by general investors with projects that were heavily invested by professional investors. Then, we were able to examine that the success rates of project subscription, which were heavily invested by general investors, were higher than the projects of professional investor type. It can be interpreted as a general investor driven crowdfunding market. Based on these results, we propose three policies. First, the supervisor should be strengthened to provide more detailed information on investment risk factors in the prospectus. Second, the crowdfunding intermediary should monitor information provided by startups. Third, an investor should be asked to add a question to the investment compliance test that allows the investor to recognize the problem in the manual.

오인식 형태소 추정에 의한 한국어 문자 인식 후처리 기법 (A Postprocessing Method of Korean Character Recognition by Mis-recognized Morphology Presumption)

  • 김영훈;이영화;이상조
    • 전자공학회논문지C
    • /
    • 제36C권7호
    • /
    • pp.46-55
    • /
    • 1999
  • 본 논문에서는 형태소 분석을 이용한 후처리에서 속도 개선을 위해 사전 탐색 횟수를 줄이는 새로운 방법을 제안한다. 본 논문에서 제안하는 방법은, 오인식 어절 검출을 위한 형태소 분석 과정에서 분석되는 일부의 형태소 정보를 최대한 이용하여 오인식 어절의 형태소 구성을 추정한 후, 형태소 단위의 교정을 한다. 형태소 단위의 교정은 어절보다 길이가 짧으므로 최악의 경우라도 생성되는 후보의 수가 어절 단위의 교정보다 적다. 특히, 생성된 후보가 형태소 단위이므로 사전 탐색만으로 올바른 후보를 선택할 수 있으므로 형태소 분석으로 인한 사전 탐색 횟수를 줄일 수 있다. 본 논문에서 제안한 형태소 정보를 이용한 후처리는 기존의 어절 단위 후처리에 비해 생성된 후보의 형태소 분석이 필요 없다. 생성된 후보가 형태소이므로 사전 탐색에 의해 올바른 후보를 선택할 수 있었다. 이로 인해 사전 탐색 횟수는 어절 단위 후처리와 비교하였을 때 60%나 감소되었으며 후처리 결과 문자 인식기의 음절 인식률이 94%에서 97%로 향상되었다.

  • PDF

Sequence-to-sequence 기반 한국어 형태소 분석 및 품사 태깅 (Sequence-to-sequence based Morphological Analysis and Part-Of-Speech Tagging for Korean Language with Convolutional Features)

  • 이건일;이의현;이종혁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.57-62
    • /
    • 2017
  • 기존의 전통적인 한국어 형태소 분석 및 품사 태깅 방법론은 먼저 형태소 후보들을 생성한 뒤 수많은 조합에서 최적의 확률을 가지는 품사 태깅 결과를 구하는 두 단계를 거치며 추가적으로 형태소의 접속 사전, 기분석 사전 및 원형복원 사전 등을 필요로 한다. 본 연구는 기존의 두 단계 방법론에서 벗어나 심층학습 모델의 일종인 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 품사 태깅을 추가 언어자원에 의존하지 않는 end-to-end 방식으로 접근하였다. 또한 형태소 분석 및 품사 태깅 과정은 어순변화가 일어나지 않는 특수한 시퀀스 변환과정이라는 점을 반영하여 음성인식분야에서 주로 사용되는 합성곱 자질을 이용하였다. 세종말뭉치에 대한 실험결과 합성곱 자질을 사용하지 않을 경우 97.15%의 형태소 단위 f1-score, 95.33%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었고, 합성곱 자질을 사용할 경우 96.91%의 형태소 단위 f1-score, 95.40%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었다.

좌최장일치법과 HMM을 결합한 경량화된 한국어 형태소 분석 (Light Weight Korean Morphological Analysis Using Left-longest-match-preference model and Hidden Markov Model)

  • 강상우;양재철;서정연
    • 인지과학
    • /
    • 제24권2호
    • /
    • pp.95-109
    • /
    • 2013
  • 본 논문에서는 제한된 자원을 사용하는 기기에 적합한 경량화된 한국어 형태소 분석 및 품사 부착 방법을 제안한다. 관련된 초기 연구로는 규칙에 기반을 둔 방법들이 적용되었으나 최근에는 통계에 기반을 둔 방법들을 중심으로 연구되고 있다. 계산 처리 능력과 사용 가능한 메모리가 제한되는 환경에서는 규칙에 기반을 둔 방법보다 상대적으로 많은 자원을 사용하는 통계에 기반을 둔 방법을 사용하여 형태소 분석 및 품사 부착을 수행하기에는 한계가 있다. 본 논문에서는 기존의 규칙에 기반을 둔 형태소 분석 방법인 좌최장일치법을 개선하여 형태소 분석을 수행하고, 통계적인 방법인 hidden Markov model을 축소하여 형태소 품사 부착을 수행한다. 제안하는 방법은 기존의 hidden Markov model을 사용한 시스템과 유사한 성능을 보여주며 소량의 메모리 사용과 월등히 빠른 속도로 형태소 분석 및 품사 부착을 수행할 수 있다.

  • PDF

한국 기업 이름의 형태론적 연구 (A Morphological Analysis of Korean Business Names)

  • 강은경
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.157-166
    • /
    • 2020
  • 본 연구는 코스닥(KOSDAQ)에 상장된 총 1,358개의 기업 이름을 대상으로 의미와 내부구조를 분류하고 형태론적인 특성을 고찰한 기술적 연구이다. 어원적 측면에서 코스닥 기업 이름의 가장 큰 특성은 영어의 독점적 지위와 한국식 영어 조어로 밝혀졌다. 특히 코스닥 기업 이름의 경우 한국어 요소만 참여한 것은 20%에 불과하고 나머지는 외국어 요소가 참여하는데, 그중 영어 요소가 관여한 것이 전체의 76%로, 영어의 독점적 지위가 확인되었다. 형태 구조 면에서 합성어와 축약어, 축약 합성어가 90%에 달하는데, 영어 원단어의 형태적 특성과 무관하게 축약어가 많이 사용되고, 같은 단어라도 여러 형태로 축약되어 참여하는 형태를 보인다. 접두사나 접미사, 결합형등 영어의 의존형태소들도 자유롭게 독립어로 활용된다. 이것은 이들이 영어에서 차용된 것이 아니라 한국어에서 생성된 단어라는 것을 보여주는 것으로, 한국식 영어라는 것을 보여주는 것이다.

재배통의 흔들음 정도에 따른 콩나물의 생장과 형태 변화 (Changes in Growth and Morphological Characteristics of Soybean Sprouts in Response to Agitation of Culture Box)

  • 홍동오;이창우;김홍영;김희규;강진호
    • 한국자원식물학회지
    • /
    • 제19권2호
    • /
    • pp.199-203
    • /
    • 2006
  • 콩나물의 상품성은 형태에 따라 크게 변한다. 본 연구는 상면살수 방식에서 재배통의 흔들음 정도가 콩나물의 생장과 형태에 미치는 영향을 조사하고자 재배 초기 3일간의 흔들음 횟수(0, 3, 5회/일)와 기간(5회/일로 1, 2, 3일)을 달리하여 시험을 수행하였던 바 그 결과를 요약하면 다음과 같다. 1. 개체당 형성된 세근수는 흔들음 횟수와 기간이 증가할수록 적어지는 경향을 보였다. 2. 콩나물 전체길이는 흔들음 횟수와 기간간에 차이가 없었다. 그러나 흔들음 횟수와 기간이 많고 길수록 하배축은 짧아졌던 반면, 뿌리는 길어지는 것으로 조사되었다. 3. 자엽 바로 아래의 hook 직경은 흔들음 횟수가 증가할수록 커졌으나, 하배축 중간부분의 직경은 흔들음 횟수와 기간간에 차이가 없는 것으로 나타났다. 4. 개체당 각부위 및 전체 생체중과 건물중은 흔들음 횟수와 기간간에 차이가 없었다. 따라서 상면살수 방식에서 재배통의 흔들음은 콩나물의 생장보다는 형태에 주로 영향을 미치는 것으로 나타났다.

강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법 (A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.946-950
    • /
    • 2010
  • 기계 학습 기반의 많은 감정 분류 시스템들은 문장으로부터 언어적 자질을 추출하기 위하여 형태소 분석기를 사용한다. 그러나 온라인 상품평에는 많은 띄어쓰기 오류 및 철자 오류가 포함되어 있어서 일반적으로 형태소 분석기가 좋은 성능을 내기 어려우며, 기반 시스템의 낮은 성능은 감정 분류 시스템의 성능하락을 초래한다. 이러한 문제를 해결하기 위하여 본 논문에서는 어절 패턴과 음운 패턴의 최장 일치 매칭(matching)에 기반한 자질 추출 방법을 제안한다. 두 종류의 패턴은 대용량의 품사 부착 말뭉치로부터 자동으로 구축된다. 어절 패턴은 영사, 동사와 같은 내용어를 포함하는 어절들로 구성되며, 음운 패턴은 동사나 형용사와 같은 용언의 초성과 중성의 쌍으로 구성된다. 음운 패턴에 초성과 중성만을 사용한 이유는 철자 오류에 영향을 덜 받기 때문이다. 제안 방법을 평가하기 위하여 SVM(Support Vector Machine)을 기계 학습기로 사용하는 감정 분류 시스템을 구현하였다. 한국어 상품평에 대한 실험에서 제안 방법을 자질 추출 모듈로 사용하는 감정 분류 시스템이 형태소 분석기를 사용하는 것보다 우수한 성능을 보였다.

형태학적 영상처리를 이용한 어체 측정 시스템 개발에 관한 연구 (A Study on System for measuring morphometric characteristis of fish using morphological image processing)

  • 이동길;양용수;김성훈;최정화;강준구;김희제
    • 수산해양기술연구
    • /
    • 제48권4호
    • /
    • pp.469-478
    • /
    • 2012
  • To manage, sort, and grade fishery resources, it is necessary to measure their morphometric characteristics. This labor-intensive task involves performing repetitive operations on land and on a research vessel. To reduce the amount of labor required, a vision-based automatic measurement system (VAMS) for the measurement of morphometric characteristics of flatfish, such as total length (TL), body width (BW), and body height (BH), has been developed as part of a database management system for fishery resources management. This system can also measure the mass (M) of flatfish. In the present study, we describe a morphological image processing algorithm for the measurement of certain characteristics of flatfish. This algorithm, which involves preprocessing, edge pattern matching, and edge point detection, is effective in cases where the flatfish being measured has a deformed tail and is randomly oriented. The satisfactory performance of the proposed algorithm is also demonstrated by means of experiments involving the measurement of the BW, TL and BH of a flatfish when it is straightened (BW : 117mm, TL : 329mm, BH : 24.5mm), when its tail is deformed, and when it is randomly oriented.

적응적 형태학적 분석에 기초한 신호등 인식률 성능 개선 (Performance Improvement of Traffic Signal Lights Recognition Based on Adaptive Morphological Analysis)

  • 김재곤;김진수
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2129-2137
    • /
    • 2015
  • 국내외적으로 무인자동차에 대한 연구와 개발이 활발히 진행되고 있다. 무인자동차를 성공적으로 구현하기 위해서는 매우 많은 요소 기술들을 필요로 한다. 특히 교통신호등의 검출과 인식 시스템은 무인자동차에서 컴퓨터 비전 기술의 핵심적인 요소기술로 주목 받고 있다. 최근까지 제안된 대부분의 교통 신호등 인식 방식들은 잡음과 환경적인 요소에 따라 의존적인 색깔 성분 분석 방법을 사용함으로써 인식률 개선에 있어 제한적인 성능 특성을 갖고 있다. 본 논문에서는 이러한 기존의 방식의 한계를 극복하기 위해 교통신호등이 갖는 형태학적인 특성을 최대한 고려한 방법을 제안한다. 제안한 방식은 색깔 성분과 사각형 특성, 원형 특성과 같은 형태학적 특성을 동시에 고려함으로써 인식 효율을 크게 증대시킨다. 다양한 모의실험을 통하여 제안한 방식은 교통신호등 인식률뿐만 아니라 오인식률 성능을 크게 개선시킬 수 있음을 보인다.

The first record of Ulva adhaerens(Ulvaceae, Chlorophyta) from Jeju Island, Korea

  • Hyung Woo, Lee;Eun Hee, Bae;Myung Sook, Kim
    • Journal of Species Research
    • /
    • 제11권4호
    • /
    • pp.266-277
    • /
    • 2022
  • The current surveys of Ulva in the subtidal area around Jeju Island give a chance to discover unrecorded green algal species of the Korean macroalgal flora. As a result of this investigation, we found Ulva adhaerens Matusmoto & Shimada, inhabiting the subtidal regions, up to 15 m deep, and conducted the DNA barcoding on plastid rbcL-3P and tufA regions with describing the morphological characteristics. Our specimens of U. adhaerens forms a monophyletic clade with the Japanese type specimen and U. piritoka Ngāti Kuri, Heesch & W.A. Nelson from New Zealand exhibiting each 0.3% sequence divergences, respectively, in the plastid rbcL-3P. The genetic variation of U. adhaerens clade is 1.0-3.9% in rbcL-3P and 4.8-9.8% in tufA to each Ulva species, including the generic type, U. lactuca Linneaus. The morphology of Korean U. adhaerens specimens is identical to the type specimens of U. adhaerens from Japan having the development of rhizoidal filaments from both of the cell layers of the distromatic blade and the extension of rhizoidal clumps with adhesive trait between blades by extended rhizoidal clumps at the basal blades. The thallus attachment to substrate is by numerous minute discoidal plates made up of rhizoids originating from the inner part of distromatic blades in basal. Although there are still some problems to resolve the relationship between U. adhaerens and U. piritoka in the rbcL dataset and the phylogenetic pattern of the Group II intron of rbcL, we propose the new record of U. adhaerens in Korean macroalgal flora based on the morphological characteristics of Korean specimens. Continued study of the genus Ulva by morphological and molecular assessment will delimit the species of Ulva, elucidate the relationships between them, and uncover the species diversity.