• 제목/요약/키워드: 용어사전

검색결과 401건 처리시간 0.029초

인스타그램 게시물 데이터를 활용한 건강기능식품 브랜드 분석 및 평가 (Analysis and evaluation of Health Functional Food(HFF) brand using Instagram post data)

  • 윤현주;신재영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.533-534
    • /
    • 2021
  • 최근 소셜 네트워크 서비스(SNS)를 통한 건강기능식품 과대광고 적발이 증가하면서 SNS를 통해 브랜드를 선택함에 있어 신뢰도가 소비자에게 중요한 요소가 된다. 본 논문에서는 인스타그램의 해시태그를 이용해 게시글을 크롤링 하여 수집된 게시물 데이터를 가공 및 분석한다. 불용어 사전을 구축해 불용어를 제거해준 뒤 브랜드 추출을 진행하고, 건강기능식품 브랜드 5개에 대한 게시글 데이터를 수집한다. 5개 브랜드의 신뢰도 측정을 위해 게시글, 해시태그, 계정명을 분석기준으로 삼아 라벨링 처리를 한다. 라벨링 된 열을 통해 절대적 수치로 점수를 부여하여 백분율로 점수를 표현한다. 신뢰도 점수와 더불어 브랜드의 고객 참여도 건수를 같이 명시해 준다.

  • PDF

용어 신뢰도 기반 유튜브 영상 필터링 웹 서비스 설계 (Design of Youtube Video Filtering Web Service based on Reliability Analysis of Terms)

  • 한소현;신희원;황윤조;김윤희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.651-654
    • /
    • 2020
  • 유튜브 등의 1인 미디어 플랫폼 열풍과 반대로, 이에 대한 엄격한 방송 규약은 존재하지 않아 생기는 여러 사회적 문제가 대두되고 있다. 이러한 1인 미디어 시청자는 원하는 정보를 찾기 위해 영상 제공자가 제공하는 정보에만 의존하여 영상을 선택하고 내용을 확인하여야 한다. 그 결과 의도한 주제와 맞지 않은 영상을 시청하게 되는 비효율성을 해결하기 위해, 본 연구에서는 용어 신뢰도 기반 유튜브 영상 필터링 웹 서비스(YouChoose)를 제안한다. YouChoose는 유튜브 리뷰 영상의 음성을 자연어 처리 기법을 이용하여 사전 처리하고 신뢰도를 도출해 사용자에게 제공함으로써 검색 시 의도와 일치하는 영상을 직접 시청 전에 추천 받을 수 있도록 한다.

생물학적 개체명 사전을 위한 구축 및 관리 도구에 관한 연구 (A Study on Construction and Management Tools for Biological Named Entity Dictionary)

  • 장현철;김태현;이현숙;박수준;박선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.853-856
    • /
    • 2003
  • 바이오 텍스트 마이닝을 위한 정보 추출의 첫 단계는 생물학적 문헌으로부터의 유전자, 단백질, 세포조직 등과 같은 생물학적 개체명의 인식이다. 생물학적 개체명의 명명법상 특징이 매우 다양하고 저자의 개성에 의해 쉽게 좌우되어 단순히 규칙이나 학습 방법 만으로는 쉽게 개체명들을 인식할 수 없다. 또한, 생물학 관련 문헌에 나오는 가능한 모든 개체명과 이들의 모든 변형을 수록하는 것은 현실적으로 불가능하므로 이를 해결하기 위해 이미 알려진 개체명에 대해서 기본적으로 사전을 탐색하고 알려지지 않은 용어들을 규칙과 통계 기반 방법을 통하여 인식하는 것이 효과적이다. 그러나 만족할 만한 수준의 양질의 사전을 구축하는 것은 쉽지 않을 뿐만 아니라 많은 비용이 소요되며, 어느 순간 만족할 만한 성능을 낼 수 있는 사전을 구축했다. 할지라도 유지 관리 하는 것이 결코 쉬운 일이 아니며 마찬가지로 많은 비용을 필요로 하게 된다. 따라서, 잘 구축된 자원으로부터 필요한 정보를 추출하여 적절한 사전을 자동으로 구축하여 활용하는 방법을 사용할 경우, 사전 구축 및 관리에 드는 많은 비용을 줄이면서도 상당히 효과적인 성능을 얻을 수 있을 것이다. 본 연구에서는 바이오 텍스트 마이닝 엔진을 위한 생물학적 개체명 사전을 자동으로 구축하고 이를 쉽게 관리하도록 하는 도구를 개발하였다.

  • PDF

관계형 데이터베이스 기반 구조적학술용어사전(STNet)의 RDF 온톨로지 변환 방식 연구 (A Study on Conversion Methods for Generating RDF Ontology from Structural Terminology Net (STNet) based on RDB)

  • 고영만;이승준;송민선
    • 정보관리학회지
    • /
    • 제32권2호
    • /
    • pp.131-152
    • /
    • 2015
  • 본 연구에서는 R2RML 방식과 Non-R2RML 방식을 각각 적용하여 RDB를 RDF 온톨로지로 변환한 결과를 비교하였다. RDB 기반의 구조적학술용어사전 데이터베이스인 STNet의 데이터를 대상으로, 변환이 완료된 데이터의 규모, 튜플당 변환에 걸리는 시간, 그리고 질의 응답 속도를 측정하였다. 변환 규모의 평가 결과 Non-R2RML 방식이 더 많은 수의 변환을 하였으며, 표현의 풍부성과 추론 가능성 정도를 높이는 변환을 수행한 것으로 나타났다. 튜플당 변환 시간의 경우 Non-R2RML 방식이 미세하지만 더 빠른 것으로 나타났으며, 질의 응답 속도는 두 방식 모두 300회 이상의 질의 횟수부터는 안정적인 성능을 보이면서 유사한 형태의 속도를 보였다. 측정에 대한 종합적 검토 결과 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 STNet과 같은 동적인 RDB에는 Non-R2RML 방식이 적절한 것으로 평가되었다.

화제한어 '도서관' 명칭의 변용과 쟁점에 관한 연구 (A Study on the Transformation and Issue of the Japanese-Chinese Word 'Library')

  • 윤희윤
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.23-44
    • /
    • 2023
  • 도서관(図書館)이란 말은 일본 메이지 중기에 서양의 library와 bibliothek를 번역한 화제한어다. 이를 한자문화권의 중국(도서관(图书馆)), 대만(도서관(圖書館)), 한국(도서관), 베트남(Dồ thư quán)이 수용하였다. 그렇다면 일본과 중국에서는 언제, 누가 서양 도서관을 최초로 소개하였는가. 일본의 중론은 계몽사상가 후쿠자와(福澤諭吉)의 『서양사정(西洋事情), 1866』이고, 중국은 개혁사상가 양계초(梁启超)의 『시무보(时务报), 1896년』 기사를 최초로 지목하는 견해가 많다. 이에 본 연구는 양국에 서양 도서관을 소개한 근대 사전, 저서, 역서, 논문, 신문기사 등을 중심으로 '도서관'이란 명칭이 등장한 시기와 인물을 추적하고 논증하였다. 그 결과, 일본에서는 모도끼(本木正栄)의 『안게리아어림대성(諳厄利亜語林大成), 1814』를 비롯한 여러 견문기 및 사전에서 다양한 용어로 서양 도서관을 기술하였기 때문에 1866년 후쿠자와 소개설은 오류다. 그리고 중국에서는 류정담(刘正埮)의 『한어외래사사전(汉语外来词词典), 1884』에 도서관이란 용어가 최초로 등장하므로 1896년 양계초 도입설은 사실이 아니다. 동일한 맥락에서 한국에서 도서관이란 용어가 최초로 사용된 시기, 1901년 일본홍도회 부산지회가 설립한 한국 최초의 도서관 명칭에 대한 추적과 논증이 요구된다.

절단검색을 지원하는 전자사전 구조 (An Electronic Dictionary Structure supporting Truncation Search)

  • 김철수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권1호
    • /
    • pp.60-69
    • /
    • 2003
  • 역화일을 파일구조로 이용하는 정보 검색 시스템에서는 검색자가 검색할 분야의 완전 단어를 알고 있어야 검색이 가능하다. 그러나 검색자가 완전 단어가 아닌 단어의 부분 문자열을 알고 있는 경우가 많다. 이럴 경우 부분 문자열을 포함하는 색인어들을 검색할 수 있다면 관련 문서들을 검색할 수 있다. 또한 검색된 문헌 수가 너무 적을 경우 부분 문자열을 포함하는 단어를 색인어로 가지는 모든 문서들을 검색하기 위한 방법이 필요하다. 이런 요건들을 충족시키기 위해서는 사용자는 용어 절단 방법을 이용하여 질의어를 구성할 수 있어야 하고, 검색 시스템은 절단 검색을 지원할 수 있는 전자 사전이 필요하다. 본 논문에서는 절단검색을 효율적으로 지원할 수 있는 전자 사전 구조를 설계하고 구현한다. 이 전자 사전은 저장된 단어 수에 관계없이 주어진 한 개의 단어 검색 시간 및 역 문자열로 구성된 단어 검색 시간이 빠르고 일정하다. 절단검색을 효율적으로 지원하기 위하여 트라이 구조를 이용하였으며, 빠른 검색 시간을 지원하기 위해 배열을 이용한 방법을 사용하였다. 절단된 용어의 검색 과정에서 확장할 문자열의 길이를 최소화하여 검색 시간을 줄였다.

영어 트위터 감성 분석을 위한 SentiWordNet 활용 기법 비교 (A Comparative Study on Using SentiWordNet for English Twitter Sentiment Analysis)

  • 강인수
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.317-324
    • /
    • 2013
  • 트위터 감성 분석은 트윗글의 감성을 긍정과 부정으로 분류하는 작업이다. 이 연구에서는 SentiWordNet(SWN) 감성 사전에 기반한 트윗글 감성 분석을 다룬다. SWN은 전체 영어 단어에 대해 단어의 의미별로 긍정, 부정의 감성 강도를 저장해 둔 감성 사전이다. 기존 SWN 기반 감성 분석 연구들은 문서에 출현하는 각 용어의 감성을 SWN으로부터 결정한 다음 이를 바탕으로 문서 전체의 감성을 결정하였는데, 그 방법들이 매우 다양하다. 예를 들어, 한 용어의 감성 결정 시 해당 용어의 SWN 내 의미별 긍정, 부정 감성 강도 차이들의 평균을 계산하거나 긍정과 부정 각각의 감성 강도 평균 혹은 최대값을 구하기도 하며, 문서 전체의 감성을 결정하는 경우에도 문서 내 용어들의 감성 값들에 대해 평균 혹은 최대값을 취하기도 하였다. 또한 SWN 내 형용사, 동사, 명사, 부사의 품사 집합 전체 혹은 특정 부분집합에 대해 위의 감성 결정 작업을 적용하기도 한다. 이처럼 기존 연구에서는 SWN 기반의 다양한 감성 자질 추출 절차가 시도되고 있으나 이들 자질 추출 기법 전반에 대한 성능 비교 연구는 찾기 힘들다. 이 연구에서는 SWN을 트위터 감성 분석에 활용하는 다양한 방법들을 일반화하는 절차들을 소개하고 각 방법들의 성능 비교 및 분석 결과를 제시한다.

Scratch를 활용한 프로그래밍 교육이 문제해결력 향상에 미치는 영향 (The Effect of Programming Education Using Scratch on Improving Problem Solving Ability)

  • 김현정
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2010년도 동계학술대회
    • /
    • pp.307-312
    • /
    • 2010
  • 본 연구는 초등학교 4학년 학생들을 대상으로 창의적이고 자기주도적인 문제해결력 향상에 도움이 되는 프로그래밍 수업을 재량시간을 통해 진행하려 한다. 프로그래밍 수업은 전문 용어, 결과가 눈에 쉽게 보이지 않는 이유 등으로 초등학생에게는 지루하고 어려워서 적용하기에는 부담스러운 면이 있다. 이에 본 연구는 프로그래밍을 아동인지단계에 맞추어 흥미를 느끼고 쉽게 접근할 수 있는 Scratch 프로그램을 활용하여 프로그래밍 수업을 하고자 한다. 단일 집단에게 수업을 실시하고 사전사후 검사를 통하여 Scratch 프로그램을 활용한 프로그래밍 수업이 문제해결력 향상에 도움이 되는지를 검증해 보고자 한다.

  • PDF

시소러스 브라우저의 설계 (A Study on the Design of a Thesaurus Browser)

  • 이나니
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.37-40
    • /
    • 1996
  • 정보검색과정에서 온라인 시소러스는 이용자가 생각하고 있는 개념어를 시스템의 색인어로 보다 정확하게 표현하는 동시에, 관련구조를 통해 탐색의 범위를 확장ㆍ축소할 수 있게 한다. 온라인 시소러스를 충분히 활용하기 위해서는 이용자가 시소러스의 구조에 쉽게 접근하여 계층ㆍ관련구조를 충분히 살피고, 용어 사이를 자유롭게 탐험할 수 있는 장치가 필요하다. 본 연구에서는 기존의 시소러스 표시방법의 장단점 등에 근거하여 정보검색과정에서 이용할 수 있는 시소러스 브라우저를 사전탐색 기능, 시소러스 구조의 표시 기능, 탐색문 형성 기능으로 나누어 설계하였다.

  • PDF

국제 전력반도체 심포지움(ISPSD '95)에 다녀와서

  • 최연익
    • 전기의세계
    • /
    • 제44권6호
    • /
    • pp.40-45
    • /
    • 1995
  • 3일간의 심포지움을 통하여 느낀점을 몇가지 적어보면 다음과 같다. 참서자들이 첫날부터 마지막 날까지 오전, 오후 1회의 coffee break를 제외하고는 하루 종일 강연회장에 앉아서 열심히 경청하며 노트하고, 질문하는 등 열의가 대단했다. 또한 일본인 발표자 및 질문자를 위해 동시 통역을 고용하였는데, 영어 소통능력이 부족하더라도 당당하게 일어로 질의 응답을 함으로써 정보 교류가 가능하도록 배려한 점은 앞으로 우리나라에서 이와 같은 심포지움을 개최하게 될때 검토해야 할 것 같다. 특히 통역이 여성이었는데 전력 반도체 관련 용어에 매우 정통해 있고, 사전에 논문을 검토하여 질의 응답시 전문가 이상으로 능력을 발휘하는 것을 보고 우리도 이와 같은 전문 분야별 통역의 양성이 필요하다는 것을 느꼈다.

  • PDF