• 제목/요약/키워드: text extraction

검색결과 465건 처리시간 0.035초

웹기반의 전자원문 관리 시스템에 관한 연구 (A Study on the Advanced Electronic Book System Based in Web)

  • 남영준;정의섭;유재영;조현양
    • 한국비블리아학회지
    • /
    • 제16권2호
    • /
    • pp.139-156
    • /
    • 2005
  • 본 논문에서는 전자책으로써 웹기반 전자원문을 관리하는 시스템 개선방안을 제시하였다. 개선의 방향은 이용자(사용자와 관리자)의 전자원문 열람 및 관리 편의성을 극대화하는 것이다. 전자원문 관리시스템의 주요 개선된 기능은 다음과 같다. 1) 웹 브라우저를 통해 열람과 관리를 할 수 있어 특정 프로그램에 종속적이지 않다. 2) 이미지 컨텐트(표, 이미지, 아이콘 등)를 최소화하여 한 화면에 정보의 전달성과 가독성을 높일 수 있다. 3) 색인어 추출을 비롯한 장, 절 구조화 업무를 자동화하여 이를 위한 노력을 경감할 수 있다. 4) 전자원문 열람과정에서 생성되는 이용자 로그파일을 여러 관점에서 수집할 수 있다. 5) 이용자 열람시에 해당 전자원문의 암호화와 복호화를 통해 저작권 관리를 용이하게 할 수 있다. 이상과 같이 검색효율성 및 편리성을 증진시킨 인터페이스 등의 결과를 한국과학기술정보연구원의 부품소재정보망(MCT-net)에 적용하여 제안된 연구결과의 신뢰성을 확보하였다.

  • PDF

키워드를 위한 시퀀셜 패턴 평가 지표와 SNS 팔로워의 관계를 이용한 사용자 관심사항 추출방법 (Extracting Method of User's Interests by Using SNS Follower's Relationship and Sequential Pattern Evaluation Indices for Keyword)

  • 신봉희;전혜경
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.71-75
    • /
    • 2017
  • SNS 등의 보급으로 인해 Web 기반의 소비자 생성 데이터는 기하급수적으로 늘어나는 추세이다. 수많은 데이터 속에서 사용자의 관심에 맞는 콘텐츠를 정확히 추출하는 것은 여러 분야에서 중요하다. 특히 비즈니스 분야에서는 많은 사용자들 속에서 자신들에게 적합한 고객을 찾아 마케팅 정책을 수립하는 것이 중요하다. 본 논문에서는 트위터의 팔로우-팔로잉 관계를 통해 각 계정에 관심이 있는 고객들을 중심으로 중요한 정보를 얻고자 한다. 현재 트위터의 팔로워 간의 관계는 사용자의 세부 관심 사항을 반영하지 않는다. 그러므로 본 연구에서는 팔로우들의 트윗에 대한 키워드 추출 방법을 사용하여 세부 관심 사항을 파악하려고 한다. 이를 위해 국내 상업 트위터 계정 2곳을 선정하여 팔로워로부터 수집한 텍스트 데이터의 마이닝 핵심 문구에 대한 순차 패턴 평가 지표를 적용한다.

3차원 형상 모델의 디지털 워터마킹 구현 (The Implementation of the Digital watermarking for 3D Polygonal Model)

  • 김선형;이순흠;김기석;안덕상
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.925-930
    • /
    • 2002
  • 워터마킹은 DRM(digital rights management)의 요소 기술로서 많은 연구가 진행되어 왔다. 하지만, 3D 신속 조형 기술(RP : rapid proto-typing)에 적용된 연구는 찾아보기 어렵다. 대부분의 연구가 텍스트 문서, 2D 이미지, 동영상, 음악 등의 컨텐츠에 한정되어 있다. RP 시스템은 다품종 소량 생산에 적합하고, 시제품을 제작하여 제품개발 초기 단계에서 설계상의 오류나 부적합한 요인을 조기에 발견하는 것이 가능한 까닭에 산업 현장에 많이 사용되고 있다. 본 논문은 3D 형상 모델을 가지고 있는 STL(stereolithography) 파일에 워터마크를 삽입하는 방법에 관한 연구이다. 제안된 알고리즘은 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크를 삽입한다. 이런 까닭에 3D 형상에는 어떠한 왜곡도 발생하지 않으며 워터마크의 비가시성(invisibility)을 충족한다. 제안된 알고리즘으로 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크 데이터의 삽입과 추출이 가능함을 보여주었으며, 본 연구의 실험 결과는 fragile 워터마킹과 robust 워터마킹과의 이용가능성을 제시하였다.

포인터 네트워크를 이용한 멘션탐지 (Mention Detection with Pointer Networks)

  • 박천음;이창기
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.774-781
    • /
    • 2017
  • 멘션(mention)은 명사 또는 명사구를 중심어로 가지며, 수식어를 포함하여 어떤 의미를 정의하는 구(chunk)를 구성한다. 문장 내에서 멘션을 추출하는 것을 멘션탐지라 한다. 멘션들 중에서 서로 같은 의미의 멘션들을 찾아내는 것을 상호참조해결이라 한다. 포인터 네트워크는 RNN encoder-decoder 모델을 기반으로, 주어진 입력 열에 대응되는 위치를 출력 결과로 갖는 모델이다. 본 논문에서는 멘션탐지에 포인터 네트워크를 이용할 것을 제안한다. 멘션탐지에 포인터 네트워크를 적용하면 기존의 순차 문제로는 해결할 수 없었던 중첩된 멘션탐지 문제를 해결할 수 있다. 실험 결과, 본 논문에서 제안한 멘션탐지의 성능이 규칙기반 보다 7.65%p 이상 높은 F1 80.07%를 보였으며, 이를 이용한 상호참조해결 성능이 CoNLL F1 56.67%(멘션 경계), 60.11%(중심어 경계)로 규칙기반 멘션탐지를 이용한 상호참조해결에 비하여 7.68%p, 1.5%p 더 좋은 성능을 보였다.

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

상한론 탕제(傷寒論 湯劑)에서 대황(大黃) 1일 복용량과 추출법 (The Daily Dose and Decoct Method of Rhubarb in Treatise on Cold Damage Diseases)

  • 김인락
    • 대한본초학회지
    • /
    • 제31권3호
    • /
    • pp.37-41
    • /
    • 2016
  • Objectives : The purpose of this study is to assume the size of sliced piece, daily dose and extracting Method of Rhubarb in Treatise on Cold Damage Diseases.Methods : I contrast results of recent studies with assuming results based on original text of Treatise on Cold Damage Diseases.Results : Daily dose was 6, 4 or 2 Ryang in case of cutting Rhubarb in bean-size. These prescriptions were decocted with water or sinked in boiled water. Another daily doses were large baduk-piece size 6 units and baduk-piece size 6 units in case of cutting Rhubarb in size bigger than bean. The former was used in adding to the Jisilchijasi-tang in case of constipation, the latter was used in Sihogayonggolmoryeo-tang and Jeodang-tang. The size of large baduk-piece was 2.32 cm in width, 4.64 cm in length, 4.3 g in weight, and the length and weight of baduk-piece was half of that was. Two sizes of Rhubarbs were sunk in water for 12 hours. After decocting the other ingredients, mixed Rhubarb extraction and Rhubarb, and then boiled it for 1 minute.Conclusions : From this study, daily dose of Rhubarb was 6, 4 or 2 Ryang and the 6 pieces of large baduk-piece or baduk-piece are respectively 4 or 2 Ryang. The extracting methods was decocting, sinking in boiled water for short time, sinking in water for long time and then mixing these with other decocted solution.

웨이블릿 변환를 이용한 MPEG 디지털동영상 워터마킹에 관한 연구 (A Study on Digital Watermarking of MPEG Coded Video Using Wavelet Transform)

  • 이학찬;조철훈;송중원;남궁재찬
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.579-586
    • /
    • 2001
  • 디지털 워터마킹이란 영상이나 비디오, 오디오, 텍스트 등의 저작물에 잘 식별되지 않은 표시를 삽입하여 저작권을 보호하는 방법으로 소유권자의 동의 없이 저작물을 배포, 복사되는 것을 방지하는 방법이다. 본 논문에서는 MPEG 기반의 압축된 영상에 저작권 보호를 위한 시스템의 구현을 위하여 휘도신호에 웨이블릿을 이용한 워터마크 키의 삽입과 추출에 대하여 연구한다. 우선, 원 이미지를 이산 웨이블릿 변환을 이용하여 주파수 영역으로 분해한다. 이 때, RSA(Rivest, Shamir, Aldemen) 공개키(public key)의 암호화 대상을 VLC(variable length coding) 파라메터의 RUN으로 하였다. 이웃하는 RUN파라메터 사이의 높은 연관성은 이미지 전체에 영향을 미치기 때문에 비밀키(private key)를 소유하지 않은 비인가자의 불법적인 행위를 막을 수 있다. 실험 결과, DCT기반의 저주파 대역에 대한 직접적인 암호화 방식〔13〕보다 더 적은 키를 삽입시키면서 오히려 더 높은 왜곡과 위치가 이동된 이미지를 얻을 수 있었다.

  • PDF

수묵화를 이용한 VR 융합콘텐츠 제작공정 연구 (A Study on VR Convergence Contents Creation Process ink painting)

  • 후정동;최철영
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.193-198
    • /
    • 2018
  • 최근의 VR 기술을 애니메이션 영역에 적용하는 것은 필연적인 추세로 보여진다. 이러한 VR 기술을 기존의 수묵애니메이션에 활용하면 평면적인 예술 작품이 새로운 서사방식과 시청각 언어를 갖추어 새로운 애니메이션 장르로 갖추게 될 것으로 보인다. 하지만 새로 개발하는 것이 아닌 기존의 평면적인 수묵 이미지를 360도 화면에 배치하기 위해서는 기술적으로 많은 어려움이 존재하는데 기존에 제작된 수묵 애니메이션의 배경 수묵 이미지에서 거리의 깊이에 따른 레이어 추출과 360도 공간에 이들을 깊이에 따른 곡면에 배치를 통해 VR 공간에 깊이감을 부여하는 VR수묵 애니메이션을 제작해 보려하였다. 본문에서는 기존의 수묵화 이미지에서 원경, 근경, 중경 레이어를 추출하는 과정에서 발생하는 문제점을 살펴보고 이를 해결하기 위한 접근 방법들을 찾아보고 제시해보려 하였다.

Wavelet 변환을 이용한 영상압축 및 검색 시스템의 구현 (Implementation of Image Compression and Searching System using Wavelet Transform)

  • 윤정모;김상연
    • 전자공학회논문지CI
    • /
    • 제38권4호
    • /
    • pp.50-58
    • /
    • 2001
  • 영상정보는 시각적이며, 공간적인 정보로 멀티미디어에서 가장 많이 사용되고, 저장과 출력 방식의 다양성, 대용량, 공간관계 표현 및 비정형적이라는 특징을 갖는다. 따라서 이러한 영상데이터의 효율적인 저장, 관리 및 검색기법에 대한 다양한 연구가 진행 중에 있고 최근 멀티미디어 환경에서의 내용기반의 검색에 관한 MPEG-7이라는 국제적인 표준화 움직임이 일어나고 있다. 특히 다량의 영상정보를 데이터베이스에 저장하고 효율적으로 질의.검색할 수 있는 실용화된 영상검색 시스템이 아직 일반화되어 있지 않으므로 보다 효과적인 영상 데이터베이스 검색 시스템의 구현에 대한 연구가 중요한 과제이다. 현재 텍스트기반의 영상 검색시스템은 상당히 연구가 진행되어 있으나, 많은 단점으로 인하여 최근에는 내용기반의 검색시스템에 대한 많은 연구가 진행중이다. 본 연구에서는 기존의 시스템에서 많이 사용하던 DCT기법 대신 영상처리에서 많이 사용하고 있는 wavelet변환을 사용하여 영상의 압축과 특징벡터를 추출하여 기존의 방법과 같고 정확한 결과를 얻을 수 있었다.

  • PDF

북스캔 만화 저작물 식별 시스템에 관한 연구 (A Study on An Identification System for Scanned Cartoon Book)

  • 한병준;김태현;강호갑;조성환;이근영
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.131-137
    • /
    • 2014
  • 만화저작물은 웹하드 서비스의 급증과 스마트기기의 보급으로 인하여 불법 복제가 만연하고 있으나 음악, 동영상과 같이 저작물을 식별할 수 있는 핑거프린팅 기술 개발이 이루어지지 않아 무차별 복제에 따른 저작권자들의 피해 규모가 크게 발생하고 있다. 한국저작권위원회의 저작권 R&D 과제로 진행되고 있는 북스캔 만화 저작물 식별기술 연구(과제명 : 북스캔 어문/만화 저작물 식별 및 복제방지 기술 개발)는 불법으로 유통되는 북스캔 만화를 효과적으로 식별할 수 있는 기술 개발을 통하여 만화 저작권자들의 수익 기반 확대와 만화저작물의 건전한 생태계 조성 기반을 목적으로 진행되고 있다. 본 논문은 동영상 특징점 추출 알고리즘으로 기 연구된 계층적-대칭-차이-특징점 방식의 알고리즘을 기반으로 한 북스캔 만화 저작물 식별 시스템에 대한 구현 모델을 제시하고자 한다.