• 제목/요약/키워드: Natural language process

검색결과 242건 처리시간 0.026초

지식베이스를 이용한 작업자 증상 기반 화학물질 추정 시스템 설계 (Worker Symptom-based Chemical Substance Estimation System Design Using Knowledge Base)

  • 주용택;이동훈;신은지;유상우;신동일
    • 한국가스학회지
    • /
    • 제25권3호
    • /
    • pp.9-15
    • /
    • 2021
  • 본 논문에서는 산업현장 화학물질 인체 접촉 증상 기반 지식베이스 구축 및 화학물질 추정 시스템 설계에 대한 연구이다. 미국NIH에서 제공하는 WISER 프로그램의 499개의 화학물질 접촉 증상 정보로 활용하였다. 지식베이스 구축을 위해 AllegroGraph 7.0.1 프로그램을 이용하였으며 입력된 Chemical structure로 Triple 값인 Cas No., Synonyms, Symptom, SMILES, InChl, Formula를 사용 하였다. 또한 작업자의 증상을 안내하는 방법은 AI 스피커를 활용한 방식이 가능하며 지식베이스 구축 결과 암모니아(CAS No: 7664-41-7)를 기준으로 39개의 증상이 WISER 프로그램과 동일함을 확인 하였다. 이를 통해 화학물질 추정 시스템의 증상 추출 과정에 지식베이스 구축이 가능하였다.

지도학습 머신러닝 기반 카테고리 목록 분류 및 추천 시스템 구현 (Development of Supervised Machine Learning based Catalog Entry Classification and Recommendation System)

  • 이형우
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.57-65
    • /
    • 2019
  • 200 만명 이상의 회원을 보유하고 있는 "도매꾹" B2B 온라인 쇼핑몰인 경우70% 이상의 시장 점유율로 하루에 80만개 이상의 아이템이 판매되고 있다. 하지만, 동일하거나 유사한 물품이 서로 다른 카탈로그 엔트리에 저장 및 등록되어 있기 때문에 구매자가 아이템을 검색하는 과정에서 어려움을 느끼며 B2B 대형 쇼핑몰 관리에도 문제점이 발생하고 있다. 따라서 이에 대한 해결 방안으로 본 연구에서는 대단위 쇼핑몰 구매 정보를 기반으로 지도-학습 머신러닝 기법을 적용하여 상품에 대한 카탈로그 목록 자동 분류 및 추천 시스템을 개발하였다. 구체적으로 판매자가 자연어 형태로 물품 등록 정보를 입력하면 KoNLPy 형태소 분석 과정을 수행하였으며, Naïve Bayes 분류 방식을 응용하여 물품에 가장 적합한 카탈로그 정보를 자동으로 추천해주는 시스템을 구현하였다. 정확도가 향상된 카테고리 목록을 구축하여 결과적으로 검색 속도와 쇼핑몰 매출을 향상시키는 효과가 있었다.

음표 임베딩과 마디 임베딩을 이용한 곡의 생성 및 정량적 평가 방법 (Creating Songs Using Note Embedding and Bar Embedding and Quantitatively Evaluating Methods)

  • 이영배;정성훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.483-490
    • /
    • 2021
  • 인공신경망을 이용해서 기존 곡을 학습시키고 새로운 곡을 생성하기 위해서는 전처리 과정으로 곡을 신경망이 인식할 수 있는 숫자로 변환해야 하며, 지금까지는 원-핫 인코딩이 사용되어 왔다. 본 논문에서는 음표 임베딩과 마디 임베딩을 제안하고 기존의 원-핫 인코딩과 성능을 비교하였다. 성능비교는 어떤 방식이 작곡가가 작곡한 곡과 유사한 곡을 생성하는지를 정량적 평가에 근거해서 수행하였으며, 평가방법으로는 자연어 처리 분야에서 사용되는 정량적 평가 방법들을 이용하였다. 평가결과 마디 임베딩으로 생성한 곡이 가장 좋았으며 그 다음으로 음표 임베딩이 좋았다. 이는 본 논문에서 제안한 음표 임베딩과 마디 임베딩이 원-핫 인코딩보다 작곡가가 작곡한 곡과 유사한 곡을 생성한 것으로서 의의가 있다.

System for Supporting the Decision about the Possibility of Concluding the Civil Law Agreements for Medical, Therapeutic and Dental Services

  • Hnatchuk, Yelyzaveta;Hovorushchenko, Tetiana;Shteinbrekher, Daria;Kysil, Tetiana
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.155-164
    • /
    • 2022
  • The review of known decisions showed that currently there are no systems and technologies for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services. The paper models the decision-making support process on the possibility of concluding the civil law agreements for medical, therapeutic and dental services, which is the theoretical basis for the development of rules, methods and system for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services. The paper also developed the system for supporting the decision about the possibility of concluding the civil law agreements for medical, therapeutic and dental services, which automatically and free determines the possibility or impossibility of concluding the corresponding civil law agreement for the provision of a corresponding medical service. In the case of formation of a conclusion about the possibility of concluding the agreement, further conclusion and signing of the corresponding agreement takes place. In the case of forming a conclusion about the impossibility of concluding the agreement, a request is made for finalizing the relevant agreement for the provision of the relevant medical service, indicating the reasons for the impossibility of concluding the agreement - missing essential conditions in the agreement. After finalization, the agreement can be analyzed again by the developed system for supporting the decision.

Technology of Decision-Making Support Regarding the Possibility of Donation and Transplantation Considering Civil Law

  • Hnatchuk, Yelyzaveta;Hovorushchenko, Tetiana;Drapak, Georgii;Kysil, Tetiana
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.307-315
    • /
    • 2022
  • The review of known decision-making support systems and technologies regarding the possibility of donation and transplantation showed that currently there are no systems and technologies of decision-making support regarding the possibility of donation and transplantation considering civil law. The paper models the decision-making support process regarding the possibility of donation and transplantation, which is a theoretical basis for the development of rules, methods and technology of decision-making support regarding the possibility of donation and transplantation considering civil law. The paper also developed the technology of decision-making support regarding the possibility of donation and transplantation considering civil law as a component of the Unified State Information System for Organ and Tissue Transplantation, which automatically and free of charge determines the possibility/impossibility of donation and transplantation. In the case of the possibility of donation, the admissible type of donation is also determined - over-life or after-life donation - and data about potential donor is entered in the relevant Donor Register. In the case of the possibility of transplantation, if the recipient needs a transplant of one of the paired organs or a part of the organ/tissue, then data about potential recipient are entered in the Transplantation List from both over-life and after-life donor, otherwise, if the recipient needs a transplant of a non-paired organ or both paired organs, then data about potential recipient are entered only in the Transplantation List from after-life donor.

리뷰 정보를 활용한 이용자의 선호요인 식별에 관한 연구 (Identification of User Preference Factor Using Review Information)

  • 송성전;심지영
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.311-336
    • /
    • 2022
  • 본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, '내용', '캐릭터', '글쓰기', '읽기', '작가', '스토리', '형식'의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.

초·중등 인공지능 교육을 위한 데이터 리터러시 정의 연구 (A Study on the Definition of Data Literacy for Elementary and Secondary Artificial Intelligence Education)

  • 김슬기;김태영
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.59-67
    • /
    • 2021
  • AI 기술의 발달은 우리 삶의 큰 변화를 가져왔다. 생활 속에서부터 사회, 경제에 이르기 까지 AI의 영향력이 커짐에 따라 AI와 데이터에 대한 교육에 대한 중요성이 함께 커지고 있다. 특히 OECD 교육 연구 보고서 및 다양한 국내 정보과 교육과정 연구에서 데이터와 데이터 리터러시를 다루고 필수 역량으로 제시하고 있다. 국내외 연구를 살펴 보면 데이터 리터러시에 대한 정의는 연구자들 마다 그 구체적인 내용과 범위가 다른 것을 알 수 있다. 이에 데이터 리터러시 관련 주요 연구의 정의를 다각도로 분석하여 도출하고자 하였다. 주요 연구에서 데이터 리터러시를 정의를 하는데 사용된 단어 빈도 분석과 함께 Word2vec 자연어 처리 방법을 활용하여 의미 유사도를 분석하고 교육과정 연구의 내용요소를 바탕으로 최종적으로 유목화하여 '데이터를 읽고 쓸 수 있으며, 실생활의 문제를 해결하기 위해 데이터를 이해하고 사용하여 정보로 처리하는 지식 구성의 기초 능력' 의 정의를 도출하였다. 본 연구를 통해 도출된 데이터 리터러시의 정의를 바탕으로 내용이 수정 보완되고 더 많은 연구가 이루어져 학생들의 미래 역량을 키워주는 교육 연구에 좋은 기초 자료가 될 수 있기를 기대한다.

  • PDF

북스캔을 이용한 도서 손상 단계에 따른 딥 러닝 기반 도서 복구 방법에 관한 연구 (A Study on Book Recovery Method Depending on Book Damage Levels Using Book Scan)

  • 석경호;이주희;박병찬;김석윤;김영모
    • 반도체디스플레이기술학회지
    • /
    • 제22권4호
    • /
    • pp.154-160
    • /
    • 2023
  • Recently, with the activation of eBook services, books are being published simultaneously as physical books and digitized eBooks. Paper books are more expensive than e-books due to printing and distribution costs, so demand for relatively inexpensive e-books is increasing. There are cases where previously published physical books cannot be digitized due to the circumstances of the publisher or author, so there is a movement among individual users to digitize books that have been published for a long time. However, existing research has only studied the advancement of the pre-processing process that can improve text recognition before applying OCR technology, and there are limitations to digitization depending on the condition of the book. Therefore, support for book digitization services depending on the condition of the physical book is needed. need. In this paper, we propose a method to support digitalization services according to the status of physical books held by book owners. Create images by scanning books and extract text information from the images through OCR. We propose a method to recover text that cannot be extracted depending on the state of the book using BERT, a natural language processing deep learning model. As a result, it was confirmed that the recovery method using BERT is superior when compared to RNN, which is widely used in recommendation technology.

  • PDF

Improving the Classification of Population and Housing Census with AI: An Industry and Job Code Study

  • Byung-Il Yun;Dahye Kim;Young-Jin Kim;Medard Edmund Mswahili;Young-Seob Jeong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.21-29
    • /
    • 2023
  • 본 논문에서는 인구 조사에서 산업 및 직업 코드를 자동 분류하기 위한 인공지능 기반 시스템을 제안한다. 산업 및 직업 코드의 정확한 분류는 정책 결정, 자원 할당 및 연구를 위해 매우 중요하지만, 기존의 방식은 사람이 작성한 사례 사전에 의존하는 규칙 기반 방식으로 규칙 생성에 필요한 시간과 자원이 많이 소요되며 오류 발생 가능성이 높다. 우리는 본 논문에서 통계 기관에서 사용하는 기존의 규칙 기반 시스템을 대체하기 위해 사용자가 입력한 데이터를 이용하는 인공지능 기반 시스템을 제안하였다. 이 논문에서는 여러 모델을 학습하고 평가하여 산업에서 86.76%의 일치율, 직업에서 81.84%의 일치율을 달성한 앙상블 모델을 개발하였다. 또한, 분류 확률 결과를 기반으로 프로세스 개선 작업도 제안하였다. 우리가 제안한 방법은 전이 학습 기술을 활용하여 사전 학습된 모델과 결합하는 앙상블 모델을 사용하였으며, 개별 모델과 비교하여 앙상블 모델의 성능이 더 높아짐을 보였다. 본 논문에서는 인공지능 기반 시스템이 인구 조사 데이터 분류의 정확성과 효율성을 향상시키는 잠재력을 보여주며, 인공지능으로 이러한 프로세스를 자동화함으로써 더 정확하고 일관된 결과를 달성하며 기관 직원의 작업 부담을 줄일 수 있다는 점을 보여준다.

A Study of Segmental and Syllabic Intervals of Canonical Babbling and Early Speech

  • Chen, Xiaoxiang;Xiao, Yunnan
    • 비교문화연구
    • /
    • 제28권
    • /
    • pp.115-139
    • /
    • 2012
  • Interval or duration of segments, syllables, words and phrases is an important acoustic feature which influences the naturalness of speech. A number of cross-sectional studies regarding acoustic characteristics of children's speech development found that intervals of segments, syllables, words and phrases tend to change with the growing age. One hypothesis assumed that decreases in intervals would be greater when children were younger and smaller decreases in intervals when older (Thelen,1991), it has been supported by quite a number of researches on the basis of cross-sectional studies (Tingley & Allen,1975; Kent & Forner,1980; Chermak & Schneiderman, 1986), but the other hypothesis predicted that decreases in intervals would be smaller when children were younger and greater decreases in intervals when older (Smith, Kenney & Hussain, 1996). Researchers seem to come up with conflicting postulations and inconsistent results about the change trends concerning intervals of segments, syllables, words and phrases, leaving it as an issue unresolved. Most acoustic investigations of children's speech production have been conducted via cross-sectional designs, which involves studying several groups of children. So far, there are only a few longitudinal studies. This issue needs more longitudinal investigations; moreover, the acoustic measures of the intervals of child speech are hardly available. All former studies focus on word stages excluding the babbling stages especially the canonical babbling stage, but we need to find out when concrete changes of intervals begin to occur and what causes the changes. Therefore, we conducted an acoustic study of interval characteristics of segments and words concerning Canonical Babble ( CB) and early speech in an infant aged from 0;9 to 2;4 acquiring Mandarin Chinese. The current research addresses the following two questions: 1. Whether decreases in interval would be greater when children were younger and smaller when they were older or vice versa? 2. Whether the child speech concerning the acoustic features of interval drifts in the direction of the language they are exposed to? The female infant whose L1 was Southern Mandarin living in Changsha was audio- and video-taped at her home for about one hour almost on a weekly basis during her age range from 0;9 to 2;4 under natural observation by us investigators. The recordings were digitized. Parts of the digitized material were labeled. All the repetitions were excluded. The utterances were extracted from 44 sessions ranging from 30 minutes to one hour. The utterances were divided into segments as well as syllable-sized units. Age stages are 0;9-1;0,1;1-1;5, 1;6-2;0, 2;1-2;4. The subject was a monolingual normal child from parents with a good education. The infant was audio-and video-taped in her home almost every week. The data were digitized, segments and syllables from 44 sessions spanning the transition from babble to speech were transcribed in narrow IPA and coded for analysis. Babble was coded from age 0;9-1;0, and words were coded from 1;0 to 2;4, the data has been checked by two professionally trained persons who majored in phonetics. The present investigation is a longitudinal analysis of some temporal characteristics of the child speech during the age periods of 0;9-1;0, 1;1-1;5, 1;6-2;0, 2;1-2;4. The answer to Research Question 1 is that our results are in agreement with neither of the hypotheses. One hypothesis assumed that decreases in intervals would be greater when children were younger and smaller decreases in intervals when older (Thelen,1991); but the other hypothesis predicted that decreases in intervals would be smaller when children were younger and greater decreases in intervals when older (Smith, Kenney & Hussain, 1996). On the whole, there is a tendency of decrease in segmental and syllabic duration with the growing age, but the changes are not drastic and abrupt. For example, /a/ after /k/ in Table 1 has greater decrease during 1;1-1;5, while /a/ after /p/, /t/ and /w/ has greater decrease during 2;1-2;4. /ka/ has greater decrease during 1;1-1;5, while /ta/ and /na/ has greater decrease during 2;1-2;4.Across the age periods, interval change experiences lots of fluctuation all the time. The answer to Research Question 2 is yes. Babbling stage is a period in which the children's acoustic features of intervals of segments, syllables, words and phrases is shifted in the direction of the language to be learned, babbling and children's speech emergence is greatly influenced by ambient language. The phonetic changes in terms of duration would go on until as late as 10-12 years of age before reaching adult-like levels. Definitely, with the increase of exposure to ambient language, the variation would be less and less until they attain the adult-like competence. Via the analysis of the SPSS 15.0, the decrease of segmental and syllabic intervals across the four age periods proves to be of no significant difference (p>0.05). It means that the change of segmental and syllabic intervals is continuous. It reveals that the process of child speech development is gradual and cumulative.