• 제목/요약/키워드: 단어 선정

검색결과 222건 처리시간 0.023초

객체 추출 및 객체별 그룹핑을 이용한 영상검색 결과의 단계적 서비스 방안 (A Scheme for Progressive Service of Retrieved Images based on Object Extraction and Grouping)

  • 박창민;김성영;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.180-185
    • /
    • 2002
  • 본 논문에서는 키워드를 입력해 검색된 영상들을 유사한 특징을 갖는 소수의 그룹으로 그룹핑하고 각 그룹을 대표하는 대표영상을 추출하여 우선적으로 사용자에게 보여주고 필요에 따라 나머지 영상들을 단계적으로 서비스할 수 있는 방안을 제시한다. 영상 그룹핑을 위한 각 영상의 특징은 영상에 포함된 중심 객체를 사용하여 추출한다. 이를 위해 검색 키워드는 객체와 연관성이 있는 단어로 제한하여 영상을 검색하며 검색된 영상으로부터 중심 객체를 추출할 수 있는 객체 추출 방법을 활용하였다. 각 영상으로부터 추출된 중심 객체에 대한 특징 벡터는 칼라 분포를 이용한다. 영상 그룹핑은 칼라분포로 표현되는 특징공간에서의 밀집도를 조사하여 높은 밀도로 모여있는 영역별로 추출하여 동일한 그룹으로 분류하였다. 대표 영상은 분류된 그룹에서 가장 밀집도가 높은 영상으로 선택된다. 한편, 얼굴이 포함된 영상은 사전에 따로 분류하고 얼굴 크기 및 얼굴 수에 따라 영상을 그룹핑하여 각 그룹에 대한 대표 영상을 선정한다. 본 연구에서 제안한 방법은 사용자에게 모든 검색 결과를 일괄적으로 보여주는 것에 비해 보다 빠른 시간 내에 사용자가 원하는 영상을 편리하면서도 효과적으로 확인할 수 있는 방법을 제공해 줄 수 있을 것으로 기대한다.

  • PDF

필기체한글 글자단위 분할에 관한 연구 (A study of Character segmentation of Handwritten Hangul)

  • 박아람;조범준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.831-834
    • /
    • 2004
  • 본 연구에서는 무제약으로 쓰여진 필기체 한글단어를 글자단위로 분할하는 새로운 방법을 제안한다. 이 방법은 글자와 글자사이 흑은 자소사이에 존재하는 배경(Background)정보를 세선화(Thinning) 처리하여 얻은 패스(Path)를 이용하여 글자와 글자사이를 지나는 패스를 결정하는 방법이다. 특히, 이 방법은 분할에 대한 판단을 인식기로 넘기지 않는 외적분할 방법으로 빠른 처리시간을 얻을 수 있고 외적분할 방법의 단정인 정확도를 다른 외적분할 방법에 비해서 높일 수 있었다. 제안한 방법은 필기체 한글에서 많이 발생할 수 있는 중첩(Over lap)글자와 연결(Touched)글자를 분할하는데 효과적인 성능을 보였다. 중첩글자의 경우, 세선화에 의해 생성된 패스가 자연스럽게 중첩된 부분의 사이를 지나가면서 생성되기 때문에 매우 정확한 패스를 얻을 수 있었고, 연결 글자의 경우는 연결된 부분을 판단하고, 후보영역을 선정하여 연결된 부분을 분리해내는 방법을 사용하였다.

  • PDF

텍스트 마이닝을 통한 핀테크 연관 핵심 기술 특허 추출 방법 (Essential Technical Patent Extraction Method Associated with Fintech Based on Text Mining)

  • 이황로;최은미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1219-1222
    • /
    • 2015
  • 금융과 IT가 융합되는 핀테크(Fintech)가 IT산업과 금융산업에 새로운 패러다임으로 급부상하고 있다. 핀테크 기술에 대한 기술동향을 파악하고 유사한 연관 기술을 도출하는 것은 관련 사업자가 시장 경쟁에서 우위를 차지하기 위해 필요한 전략적 방향을 제시해 준다. 하지만 핀테크와 같이 단 기간 내에 기술에 대한 파급 속도가 빠르게 일어나며 산업전반에서 기술선점의 필요성이 크게 대두되는 경우 특허 데이터베이스만으로 유사기술을 검색을 위한 키워드를 선정하는 것이 어렵다는 단점이 있다. 본 논문에서는 새롭게 이슈화되는 기술 중 그 성장세가 급격하게 변화하여 등록된 특허만으로는 연관 기술 영역을 파악하는 일이 번거로운 상황에서 기사 분석을 통해 연관 기술 키워드를 추출 할 수 있는 방법을 제안하고자 한다. 특히 핀테크에서 중요하게 인식되는 결제, 보안, 사용자환경에 대한 연관 기술 키워드를 기사 내용에 포함되는 단어의 빈도 분석을 통해 추출하고자 하였다. 최종적으로 추출된 기술 키워드를 이용하여 실제 특허 검색 데이터베이스에서 관련 특허를 수집하고 분석하여 핀테크와 관련성이 매우 높은 연관 핵심 기술 특허를 도출하였다.

온라인 커뮤니티상에 나타난 여성혐오 현상 분석 (Analyzing the phenomenon of misogyny in online community)

  • 이지현;우지영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.27-28
    • /
    • 2019
  • 본 논문에서는 한국 사회에 특유의 폭력성과 선정성으로 인해 큰 충격을 주고 있는 인터넷 커뮤니티 사이트 '일간 베스트' 글에 나타난 욕설과 여성 혐오에 대해 분석하고자 한다. 데이터는 일베 게시판에 올라온 게시글 2,000개를 웹 크롤링하여 수집하였으며, 수집한 게시글에 게임 내 금칙어 리스트와 여성 지칭어 사전을 기반으로 욕설 여부와 여성 지칭어를 태깅하였다. 태깅하여 분석한 결과 여성 지칭어를 사용한 게시글에는 욕설을 사용하는 글이 전체의 60.52%로 많았으며 욕설을 사용하지 않은 게시글에도 범행, 살해, 김치녀 등의 부정적인 단어가 많은 것을 볼 수 있었다.

  • PDF

KoreaMed MeSH 체크태그 분석 (An Analysis of KoreaMed MeSH Check Tags)

  • 정소나;이춘실
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.105-111
    • /
    • 2013
  • KoreaMed MeSH 반자동 색인 시스템이 논문 제목, 초록 그리고 저자키워드를 활용하여 부여한 KoreaMed MeSH 체크태그와 NLM의 MeSH 색인전문가가 부여한 MEDLINE MeSH 체크태그와의 일치여부를 비교 분석하였다. KoreaMed 학술지중에서 MEDLINE에 등재된 15종 학술지의 2012년 마지막 호에 실린 논문 236편을 표본으로 선정하여 일치도를 분석한 결과 MEDLINE MeSH 체크태그와 KoreaMed MeSH 체크태그와의 일치율은 30.24%였다. 그러나 KoreaMed MeSH 체크태그를 기준으로 했을 경우 MEDLINE MeSH 체크태그와의 일치율은 84.24%에 달했다. 일치율은 종별이 가장 높았고, 동물명, 성별, 연령그룹순이었다. 연령그룹에 대하여 초록내 패턴을 발견하여 반자동색인 필터로 적용한다면 일치율을 높일 수 있다. 궁극적으로는 연구의 핵심적인 연구대상이나 재료를 특정적이고 구체적인 단어 혹은 MeSH로 표현하는 초록 작성 기술이 요청된다.

  • PDF

한글디자인과 라틴 알파벳디자인의 형태유사성 고찰 1 - 윤디자인 폰트를 중심으로 - (A Consideration of the Shape Similarity between Hangeul Typeface Design and Latin Alphabet Typeface Design - focused on YoonDesign Fonts)

  • 박재홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.123-124
    • /
    • 2021
  • 본 논문은 기존 폰트 디자인을 고찰하여 한글과 라틴 알파벳 디자인의 형태 유사성을 향상시키기 위한 기초 자료를 제공한다. 고찰을 위해 윤디자인 대표 폰트 20종을 선정하였다. 형태적 관점에서 글자 디자인적 유사성을 찾기 위해 낱자, 낱글자, 낱말, 문장을 기준으로 고찰하였다. 윤디자인 대표 폰트 20종의 한글과 라틴 알파벳 글자 디자인의 결과는 다음과 같다. 첫째, 낱자(자소) 디자인은 동일한 형태이지만, 크기와 비례가 변화할 수 있다. 둘째, 낱글자(음절) 디자인은 낱글자 전체의 디자인을 위해 부분적으로 다른 형태를 디자인할 수 있다. 셋째, 낱말(단어) 디자인은 낱말의 우월효과를 고려하여야 한다. 넷째, 문장의 디자인은 글줄의 흐름을 고려하여 글자의 크기, 비례와 기준선을 디자인하여야 한다.

  • PDF

머신러닝 포키즈를 이용한 초등 AI 교육과 글쓰기 교육을 연계한 어휘력 향상 수업설계 (Vocabulary Improvement Class Design Linking Elementary School AI Education and Writing Education using 'Machine Learning for Kids')

  • 김지송;이명숙
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.719-722
    • /
    • 2021
  • 최근 인공지능의 새로운 기술들이 하루가 다르게 발전하고 있다. 이에 본 연구에서는 인공지능 교육과 글쓰기 교육을 연계하여 초등학생들의 어휘력 향상을 위한 수업을 설계하고자 한다. 그 방법으로는 본 수업에 앞서 어휘 10문제를 테스트하여 실험에 참가하기 전의 어휘력을 점검한다. 그 후 머신러닝 포키즈를 이용하여 여러 감정에 해당되는 단어들을 다양하게 훈련하도록 하였고, 그 후 관련된 어휘 10문제를 다시 테스트 하였다. 실험 결과 실험에 참가하기 전에는 100점 만점에 58.8점으로 나왔으나 훈련 후의 결과는 평균 68점으로 모든 학생의 성적이 좋아지는 결과를 얻을 수 있었다. 어휘력 문항수가 적은 점과 10명의 실험참가자로 일반화할 수 없는 한계가 있다. 향후 초등교재 한권을 선정하여 어휘를 모두 분석한 후 가장 많이 등장하는 어휘를 골라내어 테스트하여 좀 더 통계적으로 의미 있는 분석을 하고자 한다.

  • PDF

스토리기반 저작물에서 감정어 분류에 기반한 등장인물의 감정 성향 판단 (Detection of Character Emotional Type Based on Classification of Emotional Words at Story)

  • 백영태
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.131-138
    • /
    • 2013
  • 본 논문에서는 등장인물이 대사에서사용한감정어를 이용하여 등장인물의 감정 유형을 분류하는 방법을 제안하고 성능을 평가한다. 감정 유형은 긍정, 부정, 중립의 3 종류로 분류하며, 등장인물이 사용한 감정어를 누적하여 3 종류의 감정 유형 중에 어디에 속하는지를 파악한다. 대사로부터 감정어를 추출하기 위해 WordNet 기반의 감정어 추출 방법을 제안하고 감정어가 가진 감정 성분을 벡터로 표현하는 방식을 제안한다. WordNet은 영어 단어 간에 상위어와 하위어, 유사어 등의 관계로 연결된 네트워크 구조의 사전이다. 이 네트워크 구조에서 최상위의 감정항목과의 거리를 계산하여 단어별감정량을 계산하여 대사를 30 차원의 감정벡터로 표현한다. 등장인물별로 추출된 감정 벡터 성분들을 긍정, 부정, 중립의 3가지 차원으로 축소하여 표현한 후, 등장인물의 감정 성향이 어떻게 나타나는지를 추출한다. 또한 감정 성향의 추출 성능에 대해 헐리우드 영화 4개의 영화에서 12명의 등장인물을 선정하여 평가하여 제안한 방법의 효율성을 측정하였다. 대사는 영어로 이루어진 대사만을 사용하였다. 추출된 감정 성향 판단 성능은 75%의 정확도로 우수한 추출 성능을 나타내었다.

영어강세음절의 외국인어투에 관한 연구 (A Study on the Foreign Accent of English Stressed Syllables)

  • 박희석
    • 중소기업융합학회논문지
    • /
    • 제6권4호
    • /
    • pp.51-57
    • /
    • 2016
  • 본 연구는 강세음절이 있는 8개의 단어를 선정하여 원어민과 한국 대학생들 사이의 모음발음 길이를 스펙트로그램을 이용하여 측정한 후에 비교분석한 실험적 연구이다. 이 실험을 위하여 20명의 한국인 피 실험자들이 8개의 단어들이 들어있는 문장들을 발화하고 녹음하였으며, 음향적 특질들은 Praat 소프트웨어 프로그램을 이용하여 측정하였으며 그 결과를 통계분석 하였다. 분석결과, 8개의 강세모음에서 두 집단 간 차이가 있었으며, 7개의 강세모음에서는 그 차이가 유의미하였다. 두 실험집단 간 실험결과를 보면, 제1음절에 강세가 있는 모음들은 모두 집단 간 유의미한 차이를 보여주었다. 그 중에서 wonderful과 glasses의 강세음절에서는 유의미성이 크게 나타나고 있었는데, 특히 영어저모음 /${\ae}$/의 발음에서는 원어민이 한국인집단보다 훨씬 큰 길이로 발음하는 것을 알 수 있었다. 이러한 실험결과는 영어교육현장에서 외국인어투의 개선을 위한 수업자료로 활용할 수 있으리라 판단된다.

웹에서의 저가 음성인식 시스템의 구현 (The Low Cost Implementation of Speech Recognition System for the Web)

  • 박용범;박종일
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.1129-1135
    • /
    • 1999
  • DTW 알고리즘을 이용한 고립단어 인식은 화자종속이라는 상황에 있어서는 좋은 인식 율을 제공하여 준다. 그러나 DTW 알고리즘은 검색해야 할 단어가 많을 경우 검색시간이 상대적으로 높아지게 되므로 현실적으로 적용하기가 힘들다. 웹에서의 교육용 학습 지와 같이 상황 의존적 단답형 질의 응답을 요구하는 시스템의 경우에 있어서는 주어진 질문에 대한 응답이 비교적 제한되어 있어 검색대상을 줄일 수 있다. 본 논문에서는 이와 같은 상황에서 사용할 수 있는 저가형 음성 인식기를 DTW로 구현하였다. DTW의 단점을 보완하기 위해 검색할 대상을 상황에 따라 줄이는 방법을 이용하였다. 질문에 따라 관심대상을 선정하여 이들만을 검색대상으로 삼았다. 실제적인 구현을 통하여 검색대상을 줄인 결과 높은 인식 율을 얻을 수 있었고, 그룹을 설정한 만큼의 빠른 검색시간을 얻을 수 있었다.

  • PDF