• 제목/요약/키워드: text extraction

검색결과 456건 처리시간 0.024초

과학교육 분야 자연어 처리 기법의 연구동향 분석 (An Analysis of Trends in Natural Language Processing Research in the Field of Science Education)

  • 전철홍;유선아
    • 한국과학교육학회지
    • /
    • 제44권1호
    • /
    • pp.39-55
    • /
    • 2024
  • 본 연구는 2011년부터 2023년 9월까지 과학교육 분야에서 자연어 처리(NLP) 기법을 적용한 37건의 국내 및 해외 문헌을 분석하여 과학교육에서의 NLP 관련 연구 동향을 파악하고자 하였다. 특히 과학교육에서 NLP 기법의 주요 응용 분야, NLP 기법을 활용할 때 교사의 역할, 국내와 해외의 비교 측면에서 그 내용을 체계적으로 분석하였다. 분석 결과는 다음과 같다. 첫째, NLP 기법이 과학교육에서 형성평가, 자동 채점, 문헌 검토 및 분류, 패턴 추출에 중요하게 활용되고 있음을 확인하였다. 형성평가에서 NLP를 활용하면 학생들의 학습과정과 이해도를 실시간으로 분석할 수 있다. 이는 교사의 수업에 대한 부담을 줄이고, 학생들에게 정확하고 효과적인 피드백을 제공할 수 있다. 자동 채점에서는 학생들의 응답을 빠르고 정확하게 평가하는 데 기여한다. 문헌 검토 및 분류에서는 과학교육 관련 연구나 학생들의 보고서를 분석하여 주제와 트렌드를 효과적으로 분석하고, 미래 연구 방향을 설정하는 데 도움을 준다. NLP 기법을 패턴 추출에 활용하면 학생들의 생각과 반응에 나타난 공통점이나 패턴을 찾아 효과적으로 분석할 수 있다. 둘째, 과학교육에서 NLP 기법의 도입은 교사의 역할을 지식 전달자에서 학생들의 학습을 지원하고 촉진하는 지도자로 확장했고, 교사들에게 지속적인 전문성 개발을 요구한다. 셋째, 국내에서는 문헌 검토 및 분류에 집중되어 있어 국내 NLP 연구의 다양성을 위해 텍스트 데이터 수집이 용이한 환경 조성이 필요하다. 이러한 분석 결과를 바탕으로 과학교육에서 NLP 기법의 활용하는 방법에 대해 논의하였다.

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

형태와 칼러성분을 이용한 효율적인 내용 기반의 이미지 검색 방법 (Efficient Content-Based Image Retrieval Method using Shape and Color feature)

  • 염성주;김우생
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.733-744
    • /
    • 1996
  • 내용을 기반으로 한 이미지 데이타 검색은 이미지로부터 자동적으로 특징값들을 추출하여 사용자가 원하는 이미지를 검색하는 방법이다. 본 논문에서는 이미지 데이타 로부터 형태적 특징과 컬러 특징을 자동적으로 추출하여 내용을 기반으로 이미지 데이타를 검색할 수 있는 방법을 제안한다. 이를 위하여 필요한 일련의 이미지 처리 과정을 소개하고 추출된 특징값들을 빠르게 검색하기 위해 변형된 트라이와 R 트리를 사용한 인덱싱기법을 제안한다. 제안하는 검색 방법은 형태와 컬러에 대한 특징값들을 모두 취급하므로 보다 신뢰성 있는 검색을 할 수 있다. 또한 본 논문에서는 이를 바탕으로 구현된 이미지 데이타베이스와 약 200여개의 이미지 데이타를 대상으로한 검색 실험 결과를 보이며, 검색 결과를 통해 형태적 특징과 컬러 특징이 이미지가 데이타 검색에 미친 영향을 고찰해 본다.

  • PDF

웹기반의 전자원문 관리 시스템에 관한 연구 (A Study on the Advanced Electronic Book System Based in Web)

  • 남영준;정의섭;유재영;조현양
    • 한국비블리아학회지
    • /
    • 제16권2호
    • /
    • pp.139-156
    • /
    • 2005
  • 본 논문에서는 전자책으로써 웹기반 전자원문을 관리하는 시스템 개선방안을 제시하였다. 개선의 방향은 이용자(사용자와 관리자)의 전자원문 열람 및 관리 편의성을 극대화하는 것이다. 전자원문 관리시스템의 주요 개선된 기능은 다음과 같다. 1) 웹 브라우저를 통해 열람과 관리를 할 수 있어 특정 프로그램에 종속적이지 않다. 2) 이미지 컨텐트(표, 이미지, 아이콘 등)를 최소화하여 한 화면에 정보의 전달성과 가독성을 높일 수 있다. 3) 색인어 추출을 비롯한 장, 절 구조화 업무를 자동화하여 이를 위한 노력을 경감할 수 있다. 4) 전자원문 열람과정에서 생성되는 이용자 로그파일을 여러 관점에서 수집할 수 있다. 5) 이용자 열람시에 해당 전자원문의 암호화와 복호화를 통해 저작권 관리를 용이하게 할 수 있다. 이상과 같이 검색효율성 및 편리성을 증진시킨 인터페이스 등의 결과를 한국과학기술정보연구원의 부품소재정보망(MCT-net)에 적용하여 제안된 연구결과의 신뢰성을 확보하였다.

  • PDF

키워드를 위한 시퀀셜 패턴 평가 지표와 SNS 팔로워의 관계를 이용한 사용자 관심사항 추출방법 (Extracting Method of User's Interests by Using SNS Follower's Relationship and Sequential Pattern Evaluation Indices for Keyword)

  • 신봉희;전혜경
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.71-75
    • /
    • 2017
  • SNS 등의 보급으로 인해 Web 기반의 소비자 생성 데이터는 기하급수적으로 늘어나는 추세이다. 수많은 데이터 속에서 사용자의 관심에 맞는 콘텐츠를 정확히 추출하는 것은 여러 분야에서 중요하다. 특히 비즈니스 분야에서는 많은 사용자들 속에서 자신들에게 적합한 고객을 찾아 마케팅 정책을 수립하는 것이 중요하다. 본 논문에서는 트위터의 팔로우-팔로잉 관계를 통해 각 계정에 관심이 있는 고객들을 중심으로 중요한 정보를 얻고자 한다. 현재 트위터의 팔로워 간의 관계는 사용자의 세부 관심 사항을 반영하지 않는다. 그러므로 본 연구에서는 팔로우들의 트윗에 대한 키워드 추출 방법을 사용하여 세부 관심 사항을 파악하려고 한다. 이를 위해 국내 상업 트위터 계정 2곳을 선정하여 팔로워로부터 수집한 텍스트 데이터의 마이닝 핵심 문구에 대한 순차 패턴 평가 지표를 적용한다.

3차원 형상 모델의 디지털 워터마킹 구현 (The Implementation of the Digital watermarking for 3D Polygonal Model)

  • 김선형;이순흠;김기석;안덕상
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.925-930
    • /
    • 2002
  • 워터마킹은 DRM(digital rights management)의 요소 기술로서 많은 연구가 진행되어 왔다. 하지만, 3D 신속 조형 기술(RP : rapid proto-typing)에 적용된 연구는 찾아보기 어렵다. 대부분의 연구가 텍스트 문서, 2D 이미지, 동영상, 음악 등의 컨텐츠에 한정되어 있다. RP 시스템은 다품종 소량 생산에 적합하고, 시제품을 제작하여 제품개발 초기 단계에서 설계상의 오류나 부적합한 요인을 조기에 발견하는 것이 가능한 까닭에 산업 현장에 많이 사용되고 있다. 본 논문은 3D 형상 모델을 가지고 있는 STL(stereolithography) 파일에 워터마크를 삽입하는 방법에 관한 연구이다. 제안된 알고리즘은 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크를 삽입한다. 이런 까닭에 3D 형상에는 어떠한 왜곡도 발생하지 않으며 워터마크의 비가시성(invisibility)을 충족한다. 제안된 알고리즘으로 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크 데이터의 삽입과 추출이 가능함을 보여주었으며, 본 연구의 실험 결과는 fragile 워터마킹과 robust 워터마킹과의 이용가능성을 제시하였다.

포인터 네트워크를 이용한 멘션탐지 (Mention Detection with Pointer Networks)

  • 박천음;이창기
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.774-781
    • /
    • 2017
  • 멘션(mention)은 명사 또는 명사구를 중심어로 가지며, 수식어를 포함하여 어떤 의미를 정의하는 구(chunk)를 구성한다. 문장 내에서 멘션을 추출하는 것을 멘션탐지라 한다. 멘션들 중에서 서로 같은 의미의 멘션들을 찾아내는 것을 상호참조해결이라 한다. 포인터 네트워크는 RNN encoder-decoder 모델을 기반으로, 주어진 입력 열에 대응되는 위치를 출력 결과로 갖는 모델이다. 본 논문에서는 멘션탐지에 포인터 네트워크를 이용할 것을 제안한다. 멘션탐지에 포인터 네트워크를 적용하면 기존의 순차 문제로는 해결할 수 없었던 중첩된 멘션탐지 문제를 해결할 수 있다. 실험 결과, 본 논문에서 제안한 멘션탐지의 성능이 규칙기반 보다 7.65%p 이상 높은 F1 80.07%를 보였으며, 이를 이용한 상호참조해결 성능이 CoNLL F1 56.67%(멘션 경계), 60.11%(중심어 경계)로 규칙기반 멘션탐지를 이용한 상호참조해결에 비하여 7.68%p, 1.5%p 더 좋은 성능을 보였다.

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

상한론 탕제(傷寒論 湯劑)에서 대황(大黃) 1일 복용량과 추출법 (The Daily Dose and Decoct Method of Rhubarb in Treatise on Cold Damage Diseases)

  • 김인락
    • 대한본초학회지
    • /
    • 제31권3호
    • /
    • pp.37-41
    • /
    • 2016
  • Objectives : The purpose of this study is to assume the size of sliced piece, daily dose and extracting Method of Rhubarb in Treatise on Cold Damage Diseases.Methods : I contrast results of recent studies with assuming results based on original text of Treatise on Cold Damage Diseases.Results : Daily dose was 6, 4 or 2 Ryang in case of cutting Rhubarb in bean-size. These prescriptions were decocted with water or sinked in boiled water. Another daily doses were large baduk-piece size 6 units and baduk-piece size 6 units in case of cutting Rhubarb in size bigger than bean. The former was used in adding to the Jisilchijasi-tang in case of constipation, the latter was used in Sihogayonggolmoryeo-tang and Jeodang-tang. The size of large baduk-piece was 2.32 cm in width, 4.64 cm in length, 4.3 g in weight, and the length and weight of baduk-piece was half of that was. Two sizes of Rhubarbs were sunk in water for 12 hours. After decocting the other ingredients, mixed Rhubarb extraction and Rhubarb, and then boiled it for 1 minute.Conclusions : From this study, daily dose of Rhubarb was 6, 4 or 2 Ryang and the 6 pieces of large baduk-piece or baduk-piece are respectively 4 or 2 Ryang. The extracting methods was decocting, sinking in boiled water for short time, sinking in water for long time and then mixing these with other decocted solution.

웨이블릿 변환를 이용한 MPEG 디지털동영상 워터마킹에 관한 연구 (A Study on Digital Watermarking of MPEG Coded Video Using Wavelet Transform)

  • 이학찬;조철훈;송중원;남궁재찬
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.579-586
    • /
    • 2001
  • 디지털 워터마킹이란 영상이나 비디오, 오디오, 텍스트 등의 저작물에 잘 식별되지 않은 표시를 삽입하여 저작권을 보호하는 방법으로 소유권자의 동의 없이 저작물을 배포, 복사되는 것을 방지하는 방법이다. 본 논문에서는 MPEG 기반의 압축된 영상에 저작권 보호를 위한 시스템의 구현을 위하여 휘도신호에 웨이블릿을 이용한 워터마크 키의 삽입과 추출에 대하여 연구한다. 우선, 원 이미지를 이산 웨이블릿 변환을 이용하여 주파수 영역으로 분해한다. 이 때, RSA(Rivest, Shamir, Aldemen) 공개키(public key)의 암호화 대상을 VLC(variable length coding) 파라메터의 RUN으로 하였다. 이웃하는 RUN파라메터 사이의 높은 연관성은 이미지 전체에 영향을 미치기 때문에 비밀키(private key)를 소유하지 않은 비인가자의 불법적인 행위를 막을 수 있다. 실험 결과, DCT기반의 저주파 대역에 대한 직접적인 암호화 방식〔13〕보다 더 적은 키를 삽입시키면서 오히려 더 높은 왜곡과 위치가 이동된 이미지를 얻을 수 있었다.

  • PDF