• 제목/요약/키워드: 디지털 텍스트 데이터

검색결과 204건 처리시간 0.022초

macOS 파일시스템의 B-tree분석 디지털 포렌식 도구의 개발 (Development of B-tree Analyzing Tool for macOS Filesystem)

  • 조규상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.287-288
    • /
    • 2021
  • 본 논문에서는 macOS의 파일시스템인 HFS+의 B-tree구조를 디지털 포렌식의 관점에서 분석할 수 있는 기능을 갖춘 도구의 구현에 대하여 다룬다. HFS+ 파일시스템의 파일과 디렉토리에 대한 메타정보를 카탈로그 B-tree에서 구하여 디지털 포렌식 정보로 활용한다. HFS+파일시스템 포렌식 분석도구는 C/C++언어로 구현된다. 텍스트 기반의 명령행 프로그램으로 구현되며 macOS/Windows에서 터미널/명령프롬프트에서 각각 실행될 수 있도록 제작된다. 타임스탬프/파일크기/위치 등의 메타데이터의 파싱기능, 리프노드에 저장된 데이터를 이용한 파일/디렉토리 트리 구조의 재구성, B-tree구조에 의한 키워드 탐색 기능, 인덱스 노드 없이 B-tree 리프노드의 구성에 의한 파일/디렉토리 파싱/검색 기능 등이 구현된다.

  • PDF

XML 기반 가상문서에서의 멀티미디어 및 구조적 문서의 표현과 처리 (Representing and Processing Multimedia and Structured Documents For XML-Based Virtual Documents)

  • 박천수;임동수;박종현;강민구;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.246-248
    • /
    • 2000
  • 가상문서는 웹 상에 존재하는 내용 중에서 원하는 부분만을 링크를 이용해 새로운 문서를 생성하는 개념이다. 본 논문에서는 가상문서를 지원하는 디지털 도서관 시스템에서 텍스트, 이미지 데이터뿐 아니라 멀티미디어 데이터와 구조적 의미를 갖는 데이터를 처리 가능하도록 DTD의 표기법을 확장하였다. 또한, 저작도구에서 생성된 내포링크, 참조링크, 총칭링크 등 다양한 의미의 가상무서를 브라우징 가능하도록 문서 변환기에서 멀티미디어와 구조적 문서를 처리하기 위한 방법을 제시하였다.

  • PDF

한국어 음소를 이용한 자연스러운 3D 립싱크 애니메이션 (Natural 3D Lip-Synch Animation Based on Korean Phonemic Data)

  • 정일홍;김은지
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.331-339
    • /
    • 2008
  • 본 논문에서는 3D 립싱크 애니메이션에 필요한 키 데이터를 생성하는 효율적이고 정확한 시스템 개발을 제안한다. 여기서 개발한 시스템은 한국어를 기반으로 발화된 음성 데이터와 텍스트 정보에서 한국어 음소를 추출하고 분할된 음소들을 사용하여 정확하고 자연스러운 입술 애니메이션 키 데이터를 계산한다. 이 애니메이션 키 데이터는 본 본문에서 개발한 3D 립싱크 애니메이션 시스템뿐만 아니라 상업적인 3D 얼굴 애니메이션 시스템에서도 사용된다. 전통적인 3D 립싱크 애니메이션 시스템은 음성 데이터를 영어 음소 기반으로 음소를 분할하고 분할된 음소를 사용하여 립싱크 애니메이션 키 데이터를 생성한다. 이러한 방법의 단점은 한국어 콘텐츠에 대해 부자연스러운 애니메이션을 생성하고 이에 따른 추가적인 수작업이 필요하다는 것이다. 본 논문에서는 음성 데이터와 텍스트 정보에서 한국어 음소를 추출하고 분할된 음소를 사용하여 자연스러운 립싱크 애니메이션을 생성하는 3D 립싱크 애니메이션 시스템을 제안한다.

  • PDF

LSTM과 증시 뉴스를 활용한 텍스트 마이닝 기법 기반 주가 예측시스템 연구 (A study on stock price prediction system based on text mining method using LSTM and stock market news)

  • 홍성혁
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.223-228
    • /
    • 2020
  • 주가는 사람들의 심리를 반영하고 있으며, 주식시장 전체에 영향을 미치는 요인으로는 경제성장률, 경제지료, 이자율, 무역수지, 환율, 통화량 등이 있다. 국내 주식시장은 전날 미국 및 주변 국가들의 주가지수에 영향을 많이 받고 있으며 대표적인 주가지수가 다우지수, 나스닥, S&P500이다. 최근 주가뉴스를 이용한 주가분석 연구가 활발히 진행되고 있으며, 인공지능 기반한 분석을 통하여 과거 시계열 데이터를 기반으로 미래를 예측하는 연구가 진행 중에 있다. 하지만, 주식시장은 예측시스템에 의해서 단기간 적중이 되더라도, 시장은 더 이상의 단기 전략대로 움직여지지 않고, 새롭게 변할 수밖에 없다. 따라서, 본 모델을 삼성전자 주식데이터와 뉴스 정보를 텍스트 마이닝으로 모니터링하여 분석한 결과를 나타내어 예측이 가능한 모델을 제시하였으며, 향후 종목별 예측을 통하여 실제 예측이 정확한지 확인하여 발전시켜 나갈 예정임.

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

가상화 스토리지 시스템 도입 절차방법 연구 (A Study on the Regulation Improvement of the Public IT Project Contract Law)

  • 최성
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2005년도 추계학술대회
    • /
    • pp.243-249
    • /
    • 2005
  • 정보화가 발달할수록 데이터량은 증가한다. 21세기 정보화 시대가 말그대로 정보의 홍수속에 살게 될 것이다. 지금은 영상미디어 시대이다. 초고속인터넷시대는 향후 처리해야 할 정보가 단순 텍스트 데이터가 아니라 정보의 관리에 어려움을 가져왔다. 또한 인터넷이란 새로운 실시간 데이터 관리가 필요한 상황에서 고객의 어려움도 커져가고 있다. SAN(Storage Area Network)과 NAS(Network Attached Storage)는 가상화스토리지 전문기업 뿐만 아니라 이종 업체에서의 제안이다. 즉 NAS를 정의하는 방향도 다르다. 우선 서버 어플라이언스로 보는 업체로는 컴팩, IBM의 x시리즈, 마이크로테스트, 액시스 등이 있으며, IBM, 씬, EMC, 네트워크 어플리이언스, 히타치데이터시스템 등 전통적인 가상화스토리지 업체는 이를 가상화스토리지 네트워크의 한 아키텍처로 보고 있다. 이외에 맥스터, 퀸텀 등의 HDD업체들은 이를 네트워크에 연결할 수 있는 하드디스크로 보고 있다. 또한 네트워크 장비 업체인 3Com, 넷기어 등의 NAS제품을 보이는데 국내업체는 전무한 편이다. 예전에 우리가 포기한 고부가가 가치제품인 서버 스토리지 분야를 놓치면, 결코 국민소득 $2{\sim}3$만불 타령을 해야 아무런 소용도 없고 선진국에 기술 종속만 될 뿐이다. 그러므로 우리가 IT강국이라고 하는 데는 반성을 하여야 한다.

  • PDF

PDA 기반의 Mobile Commerce서비스

  • 김완식
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2002년도 e-Biz World Conference
    • /
    • pp.362-366
    • /
    • 2002
  • 일반적 정의 :"온라인 네트워크를 통해 이뤄지는 모든 형태의 거래" OECD(1997):"전자상거래는 일반적으로 개인과 조직 모두를 포함해 텍스트, 음성 화상을 포함한 디지털데이터의 처리와 전송에 기초한 상업활동과 관련된 모든 종류의 거래" 경제주체에 따른 EC의 분류 : 기업 대 기업(Business to Business), 기업 대 소비자(Business to Consumer), 소비자 대 소비자(Consumer to Consumer), 정부 대 기업(Government to Business), 정부 대 소비자(Government to Consumer), 기업 대 딜러간(Business to Dealer), 인터네 비즈니스 사이트 대 사이트(Site to Site) Mobile Commerce의 정의 일반적 정의 : 휴대폰, PDA, 노트북 등의 개인 휴대 단말기와 무선 통신네트웍을 기반으로 한 재화(Goods), 용역(Service), 정보(Information) 및 디지털 컨텐츠 등의 모든 전자적 거래(중략)

  • PDF

문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발 (Development of Intelligent OCR Technology to Utilize Document Image Data)

  • 김상준;유동희;황소영;김민호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.212-215
    • /
    • 2022
  • 오늘날 소위 디지털 전환시대를 맞아, 많은 부분에서 빅데이터의 구축과 활용에 대한 필요성이 높아졌다. 오늘날에 많은 데이터가 디지털기기, 미디어 친화적으로 생산 및 보관되는 것과 달리, 과거 오랜 기간 데이터의 생산 및 보관은 활자 인쇄도서가 주를 이루었다. 따라서 오랜 기간 축적되어온 방대한 활자 인쇄도서를 빅데이터로써 활용하기 위한 광학 문자 판독(OCR: Optical Character Recognition) 기술의 필요성 역시 빅데이터의 필요성에 맞추어 함께 요구되었다. 본 연구에서는 도서 스캔 이미지의 정보를 각 문서 객체별로 세분화하여 그 구조와 내용을 디지털화하는 시스템을 제안한다. 제안 시스템은 크게 1) 문서객체(표, 수식, 그림, 본문)의 영역정보를 인식. 2)인식된 객체의 영역정보를 각각 표 처리, 수식 처리, 텍스트 처리 모듈로 OCR. 3) OCR로 처리된 문서 정보를 JSON형식으로 종합하여 반환하는 세 단계로 구성된다. 본 연구에서 제안하는 모델은 이러한 단계를 수행함에 있어 오픈소스로 공개된 프로젝트를 활용하되, 본 시스템의 목표에 맞추어 추가적인 학습과 개량을 거쳤다. 본 연구에서 제안한 지능형 OCR 시스템은 문서 이미지 내 4종(표, 수식, 이미지, 텍스트)의 객체인식과 처리에 있어 상용 소프트웨어 수준의 성능을 확인할 수 있었다.

  • PDF

다중 네트워크 분석과 토픽 모델링을 이용한 임진왜란 시기 사료에 관한 연구 (A Study on the Imjin War's Historical Materials with Multi-layer Network Analysis and Topic Modeling)

  • 조현철;송민
    • 한국비블리아학회지
    • /
    • 제33권1호
    • /
    • pp.167-198
    • /
    • 2022
  • 융합 과학 연구가 활성화되며 인문학에서도 디지털 인문학(Digital Humanities) 연구가 장려되고 있다. 이에 본 연구는 역사 데이터에 텍스트마이닝과 개체계량학 연구 방법을 적용한 시론(試論) 연구를 제안하고자 하였다. 선조실록(宣祖實錄)·선조수정실록(宣祖修正實錄), 난중잡록(亂中雜錄), 징비록(懲毖錄)을 활용하였으며, 사료(史料)에서 주제 변화와 공통 개체를 탐색하기 위해서 네트워크 분석과 DMR 토픽모델을 사용하였다. 분석 결과를 통해서 텍스트 데이터에 대한 계량 분석의 활용 가능성 확인, 특정 주제의 시기적 변화, 인물 개체 간 미발견 관계를 제시함으로써 연구의 확장 가능성을 제안할 수 있었다.

AiMind: 디지털 인재 양성을 위한 SW·AI 융합 교육 플랫폼 (AiMind: SW·AI Convergence Education Platform for Fostering Digital Talent)

  • 이세훈;김기태;윤재광;강도형;김영호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.387-388
    • /
    • 2023
  • 본 논문에서는 인공지능(AI) 체험부터 초중등, 대학 및 평생교육에서 필요한 광범위한 응용과 활용을 할 수 있는 라이브러리를 디지털북 형태로 지원하며, 블록과 텍스트 코딩의 장점을 취합해 입문자들이 쉽고 재미있게 SW·AI 융합 교육을 할 수 있는 플랫폼을 구현하였다. 플랫폼은 웹어셈블리 기반의 파이오다이드를 통해 웹 브라우저에서 파이썬 코딩을 가능하게 하고 복잡한 설치과정 없이 쉽게 이용이 가능하다. 다양한 LMS와 연동이 가능하도록 API를 제공하며, Drag & Fill 블록으로 입문자가 코딩에 겪는 어려움 중 하나인 많은 양의 함수와 파라미터 사용법의 어려움을 해소하였다. 플랫폼은 블록으로 코딩하여 문법의 어려움, 오탈자, 오류 등을 줄이는 동시에 블록에서 생성되는 파이썬 텍스트 코드로 입문자가 텍스트 코드에 익숙해질 수 있는 경험을 제공한다.

  • PDF