• 제목/요약/키워드: Text Classification Application

검색결과 70건 처리시간 0.027초

AdaBoost를 이용한 윈도우 영상의 하위 영상 검출 (Subimage Detection of Window Image Using AdaBoost)

  • 길종인;김만배
    • 방송공학회논문지
    • /
    • 제19권5호
    • /
    • pp.578-589
    • /
    • 2014
  • 윈도우 영상은 흔히 컴퓨터에서 응용프로그램을 실행하였을 때, 모니터를 통해 출력되는 화면을 의미하여, 웹페이지, 동영상 플레이어 및 여러 가지 응용프로그램을 모두 포함한다. 웹페이지는 다른 어플리케이션에 비해 다양한 종류의 정보를 다양한 형태로 전달한다. 이러한 웹페이지와 같은 윈도우 영상은 카메라로부터 획득할 수 있는 자연영상과 달리 텍스트, 로고, 아이콘 및 하위 영상과 같은 여러 가지 요소들을 포함하고 있고, 각 요소들은 서로 다른 형식의 정보를 사용자에게 전달한다. 그러나 텍스트와 영상은 정보가 다른 형태로 제공되기 때문에, 엄연히 다른 특성을 가지고 있는 요소들을 지역적으로 분리할 필요성이 있다. 본 논문에서는 윈도우 영상을 지역적인 특성에 따라 다수의 블록으로 분할한 후, 분할된 각 영역을 배경, 텍스트, 하위영상으로 분류하였다. 이러한 분류기법을 통해 분류된 하위 영상은 3D입체영상 변환, 영상 검색, 영상 브라우징등과 같은 응용을 가질 수 있다. 영상을 분류하는 방법에는 여러 가지가 존재할 수 있으나, 본 논문에서는 기계학습 기반의 알고리즘이 하위 영상 검출에도 좋은 접근법이 될 수 있음을 증명하기 위해 AdaBoost를 이용하였고, 실험결과로부터 93.4%의 검출률, 13%의 거짓 긍정률을 보임으로서, 이를 입증하였다.

딥러닝 중심의 자연어 처리 기술 현황 분석 (Analysis of the Status of Natural Language Processing Technology Based on Deep Learning)

  • 박상언
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.63-81
    • /
    • 2021
  • 자연어 처리는 최근 기계학습 및 딥러닝 기술의 발전과 적용으로 성능이 빠르게 향상되고 있으며, 이로 인해 활용 분야도 넓어지고 있다. 특히 비정형 텍스트 데이터에 대한 분석 요구가 증가함에 따라 자연어 처리에 대한 관심도 더욱 높아지고 있다. 그러나 자연어 전처리 과정 및 기계학습과 딥러닝 이론의 복잡함과 어려움으로 인해 아직도 자연어 처리 활용의 장벽이 높은 편이다. 본 논문에서는 자연어 처리의 전반적인 이해를 위해 현재 활발히 연구되고 있는 자연어 처리의 주요 분야와 기계학습 및 딥러닝을 중심으로 한 주요 기술의 현황에 대해 살펴봄으로써, 보다 쉽게 자연어 처리에 대해 이해하고 활용할 수 있는 기반을 제공하고자 한다. 이를 위해 인공지능 기술 분류체계의 변화를 통해 자연어 처리의 비중 및 변화 과정을 살펴보았으며, 기계학습과 딥러닝을 기반으로 한 자연어 처리 주요 분야를 언어 모델, 문서 분류, 문서 생성, 문서 요약, 질의응답, 기계번역으로 나누어 정리하고 각 분야에서 가장 뛰어난 성능을 보이는 모형들을 살펴보았다. 그리고, 자연어 처리에서 활용되고 있는 주요 딥러닝 모형들에 대해 정리하고 자연어 처리 분야에서 사용되는 데이터셋과 성능평가를 위한 평가지표에 대해 정리하였다. 본 논문을 통해, 자연어 처리를 자신의 분야에서 다양한 목적으로 활용하고자 하는 연구자들이 자연어 처리의 전반적인 기술 현황에 대해 이해하고, 자연어 처리의 주요 기술 분야와 주로 사용되는 딥러닝 모형 및 데이터셋과 평가지표에 대해 보다 쉽게 파악할 수 있기를 기대한다.

네이버 영화 리뷰 데이터를 이용한 의미 분석(semantic analysis) (Semantic analysis via application of deep learning using Naver movie review data)

  • 김소진;송종우
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.19-33
    • /
    • 2022
  • SNS의 등장으로 인터넷 이용자들이 온라인에 남기는 텍스트의 양이 방대해지고 그 중요성이 강조되고있다. 특히 네이버의 영화 탭에서 볼 수 있는 영화 평점이나 리뷰는 실제로 관객들이 영화를 보기 전 해당 영화를 볼 것인지 결정하는 데 주요 요인이 되기도 한다. 본 연구는 실제 네이버 영화 리뷰 데이터를 가지고 평점을 예측하는 분석을 수행했다. 영화 리뷰 데이터를 분석하기 위해 평점의 분포를 통해 데이터 특성을 살펴보았고, 텍스트의 의미를 분석하기 위해 형태소 분석을 통한 한국어 자연어처리를 수행했다. 또한 평점 예측에 활용할 모델 선택을 위해 2-Class와 multi-Class 문제들에 대해 머신러닝과 딥러닝, 회귀와 분류 분석을 비교했으며, 오분류의 원인을 영화 리뷰 데이터 특성과 연관시켜 서술했다.

텍스트 마이닝을 통한 건설공사 공문 잠재적 리스크 유형 분석 (Analysis of Potential Construction Risk Types in Formal Documents Using Text Mining)

  • 엄세호;차기춘;박선규;박승희;박종호
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.91-98
    • /
    • 2023
  • 건설프로젝트에서 발생되는 리스크는 공기지연 및 비용증가에 큰 영향을 끼치기 때문에 다양한 리스크를 파악하기 위한 노력이 이루어지고 있다. 그러나 시공단계의 리스크 분석은 공종 및 수행단계에 국한되거나, 경험 의존적 의사결정이 주로 수행되고 있다. 데이터 기반의 분석도 일부 사례에 적용되고 있을 뿐이다. 따라서 본 연구에서는 시공사 또는 발주처에 중요한 요인들이 포함되어 있을 것으로 판단되는 수발신공문을 대상으로 군집분석과 Word2Vec 알고리즘을 적용하였다. 군집분석을 통해 6개 유형으로 1차 분류를 수행하였으며, Word2Vec을 통해 157개의 공문 발생 유형을 도출하였다. 도출된 연관어의 속성별 분석을 위하여 새로운 5개의 범주를 적용하였으며, 이를 통해 공문 발생 유형이 잠재적인 건설 리스크 요인으로 발전 가능한지 검토하였다. 텍스트 마이닝을 통한 3단계의 공문 발생 유형 분석 결과는 건설현장의 공정관리를 위한 기초 자료로써 도움 될 것으로 판단된다.

용어 확장을 통한 핀테크 기술 적용가능 산업의 탐색 :네트워크 분석 및 토픽 모델링 접근 (Exploring Potential Application Industry for Fintech Technology by Expanding its Terminology: Network Analysis and Topic Modelling Approach)

  • 박민규;전병민;김종우;금영정
    • 한국전자거래학회지
    • /
    • 제26권1호
    • /
    • pp.1-28
    • /
    • 2021
  • 핀테크는 기술주도형 금융혁신을 위한 중요한 사업 영역으로 논의되어 왔다. 핀테크라는 용어는 금융과 기술의 합성어로, 현재 모든 금융 분야와 연계된 ICT 기술을 의미한다. 핀테크 산업에 관한 관심은 시간이 지날수록 크게 높아져 수많은 스타트업에 대한 전폭적인 투자와 지원이 이루어지고 있다. 이에 따라 학문적, 실무적 시점에서 핀테크 동향을 연구하려는 시도가 있어 왔다. 그러나 시장의 높은 관심에도 불구하고 기존 연구는 핀테크 기술에 대한 명확하고 체계적인 정의 및 확장 절차가 부족하였다. 이러한 이유로 핀테크 기술을 바탕으로 적절한 응용 분야를 파악하는 것 역시 한계가 존재하였다. 이에 본 연구는 세 가지 방식을 결합하여 핀테크 관련 용어를 확장하고, 네트워크 분석과 토픽 모델링을 활용해 핀테크 분야 동향을 분석하는 새로운 방법을 제안한다. 이를 위해 새로운 핀테크 용어목록을 생성하고, USPTO로부터 10년간 총 1만 8341건의 특허를 수집하였다. 수집된 특허를 바탕으로 Co-classification 분석과 네트워크 분석을 통해 핀테크 특허의 기술 동향을 파악하였고, 핀테크 도메인을 분석하기 위해 핀테크 트렌드를 파악하는 토픽 모델링을 실시하였다. 이번 연구는 기술주도형 금융서비스에 참여하고자 하는 경영자와 투자자가 핀테크 기술의 정의와 범위를 정확히 이해하고, 이를 바탕으로 핀테크 기술의 트렌드를 다각적으로 분석함으로써 새로운 핀테크 기술 기회를 포착하는 데 도움이 될 것으로 기대된다.

위험사회 재난 안전 분야 대응을 위한 AI 조력자 (AI Advisor for Response of Disaster Safety in Risk Society)

  • 이용학;강윤희;이민호;박성호;강명주
    • Journal of Platform Technology
    • /
    • 제8권3호
    • /
    • pp.22-29
    • /
    • 2020
  • 4차 산업혁명은 초기 단순 제조업 혁신에서 사회 및 경제분야에서 다양한 기술적 융합 방향을 이끄는 메가 트랜드로서 국가별로 진행하고 있다. COVID-19와 같은 감염병의 유행은 디지털 중심의 비대면 비즈니스를 경제 운영에서 전환되고 있으며 온라인화 확산을 위해서는 개인 맞춤형서비스를 위한 AI와 빅데이터 기술의 활용은 필수적이다. 이 논문에서는 4차산업혁명을 주요한 기술 특징 및 정부에서 추진하는 디지털 뉴딜의 효과적 이행을 위해 핵심 기술인 인공지능기술의 적용을 중심으로 사례를 분석하고 재난대응 분야에서의 활용 사례를 기술한다. 재난대응 활용사례로서 AI 조력자는 긴급호출에서 신고자의 상태에 따른 적절한 대응책들을 제시한다. 이를 위해 AI 조력자는 적응적 대응을 위한 음성인식 데이터 기반 분석 및 변환 텍스트의 재난 분류를 제공한다.

  • PDF

메타버스 콘텐츠의 재미 요소 분류 (Classification of fun elements in metaverse content)

  • 이준석;이대웅
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1148-1157
    • /
    • 2022
  • 2019년 코로나로 인하여 사람들의 많은 생활에 변화를 주었다. 그중 메타버스는 다양한 방식을 통한 비대면 서비스를 지원하여 일상에서 하던 일을 대체하고 있다. 이런 현상은 코로나19의 장기화로 하나의 문화처럼 만들어지고 형성되었다. 본 논문은 메타버스의 재미요인을 알기 위해 기존 게임에서 사용한 재미요소를 정리하여 전문가 5명과 함께 항목, 내용을 메타버스에 맞게 재분류하였다. 분류는 재매개성을 사용하여 분류하였고 감각적 재미[시각(그래픽), 청각, 텍스트, 조작, 감정이입, 유희, 시점], 도전적 재미[몰입, 도전, 성취, 발견, 스릴, 보상, 문제해결], 상상적 재미[새로운 이야기, 사랑, 자유도, 대리자아, 기대감, 변화], 사회적 재미[규칙, 경쟁, 사회적 행위, 지위, 협동, 참여, 교류, 소속, 화폐거래], 상호작용적 재미[의사결정, 커뮤니케이션 공유, 하드웨어, 감정이입, 육성, 자율성], 현실적 재미[현실 일체감, 학습 용이성, 순응, 지적문제해결, 패턴 인식, 실재감, 커뮤니티], 창조적 재미[응용, 창조, 커스텀마이징, 가상세계]로 구분하였다.

e-Business Demand Education 분석에 따른 전문계고 Curriculum 연구 (A Study of Curriculum on Vocational High School under Analysis e-Business Demand Education)

  • 안재민;박대우
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.73-80
    • /
    • 2009
  • 산업별 필요인력의 수급 불균형과, 직업교육기관의 Skill Mismatch로 산업체가 요구하는 전문기술 인력 수급이 어려운 실정이다. 산업체는 학교졸업자를 현장에서 재교육하고, 산업특성에 맞는 기술을 습득하여야만 생산성을 향상 시킬 수 있다. 본 논문에서는 산업체가 요구하는 Demand Education을 수용하고, e-Business 분야에서 특성화 전문계고 Curriculum을 작성하는 연구이다. e-Business 산업분류 및 직종분류를 파악하고, e-Business 교육에 대해 산업체에서 요구하는 지식과 Skill 수준을 파악하고 그 수요를 조사하고 분석한다. 기반산업, 지원산업, 활용산업별로 조사된 e-Business Curriculum을 학습에 적용하고, 산업체의 Demand Education 계고 e-Business Curriculum의 기본 모델과 학과별 Curriculum을 제시하고, 산업체 요구의 e-Business 교육을 통한 생산성 향상을 통한 국가 발전에 기여하고자 한다.

"황제내경태소(黃帝內經太素)"의 특징(特徵) 및 양상선(楊上善)의 의학이론(醫學理論)에 대한 연구(硏究) (A Study on the Distinctive Features of "Hwangjenaegyeongtaeso(黃帝內經太素)" by Yang Sangseon and his Medical Theory)

  • 이상협;김중한
    • 대한한의학원전학회지
    • /
    • 제22권2호
    • /
    • pp.35-69
    • /
    • 2009
  • Yang Shangseon(楊上善)'s "Hwangjenaegyeongtaeso(黃帝內經太素)" was the first commentary book of "Hwangjenaegyeong(黃帝內經)", its importance often mentioned in level with Wang Bing (王冰)'s "Somun(素問)" "Yeongchu(靈樞)". The distinctive feature of Yang Sangseon(楊上善)'s commentary is that it is easy to comprehend in accordance with an organized classification, and that the explanations are simple and clear. Despite strict application of the Eumyang(陰陽, Yinyang) theory and Five phases[五行] theory throughout the text, should there be sentences which fall out of consistency with the basic theories, he added his own substantial commentary. His medical theory gives attention to the Meridian system[經絡], lays emphasis on developing the soul[神], and has a unique opinion about the Opening closing and pivot[開闔樞] theory along with the Myeongmun(命門). To explain the methods for preserving health[養生], he adopted the Nojang philosophy(老莊思想); to enrich the vitality he adopted the Buddhist philosophy(佛敎思想); and to analyze physiologic and pathogenic factors, he adopted the Confucian philosophy(儒家思想).

  • PDF

Adoption of Virtual Technology to the Development of a BIM based PMIS

  • Suh, Bong-Gyo;Lee, Ghang;Yun, Seok-Heon
    • 한국건축시공학회지
    • /
    • 제13권4호
    • /
    • pp.333-340
    • /
    • 2013
  • As construction projects become bigger, PMIS is being used as a project collaboration tool for project participants, owners, designers, inspectors and contractors. As the data type used in PMIS is usually text and most PMIS have no standard information classification system, there is a problem with data usability, such as the capacity for data search and analysis. BIM uses Objects and Properties, and this information might be used for relating with other construction information. As such, BIM technologies can be used with PMIS to enhance the data usability. The web environment is very convenient for multiple users, but the problem is that the data transfer speed is low for big files such as BIM model files. In this study, we suggested a Virtual Technology (VT) application to enhance the performance of BIM data exchange in PMIS, and tested and analyzed its efficiency when it is used to integrate BIM and PMIS in the web environment. The results of the study showed that VT can be used to enhance the efficiency of BIM data exchange in the web environment.