• 제목/요약/키워드: 디지털텍스트

검색결과 490건 처리시간 0.032초

빅데이터와 텍스트마이닝을 이용한 부동산시장 동향분석 (Analysis of Real Estate Market Trend Using Text Mining and Big Data)

  • 전해정
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.49-55
    • /
    • 2019
  • 본 연구는 빅데이터 분석방법인 텍스트마이닝을 이용한 부동산시장 동향분석에 관한 연구로 자료는 2016년 8월부터 2017년 8월까지의 포털사이트인 네이버에 게시된 인터넷 뉴스를 통해 수집하였다. TF-IDF 분석결과, 주택, 분양, 가구, 시장, 지역 순으로 빈도가 높게 나타났고 대출, 정부, 대책, 규제 등 정책과 관련된 단어들도 많이 추출되었으며 지역관련 단어는 서울의 출현빈도가 가장 많은 것으로 나타났다. 지역과 관련된 단어 조합은 '서울-강남', '서울-수도권', '강남-재건축', '서울-재건축'의 출현빈도가 많은 것으로 나타나 강남지역 재건축에 대한 사람들의 관심과 기대가 높은 것을 알 수 있다.

AiMind: 디지털 인재 양성을 위한 SW·AI 융합 교육 플랫폼 (AiMind: SW·AI Convergence Education Platform for Fostering Digital Talent)

  • 이세훈;김기태;윤재광;강도형;김영호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.387-388
    • /
    • 2023
  • 본 논문에서는 인공지능(AI) 체험부터 초중등, 대학 및 평생교육에서 필요한 광범위한 응용과 활용을 할 수 있는 라이브러리를 디지털북 형태로 지원하며, 블록과 텍스트 코딩의 장점을 취합해 입문자들이 쉽고 재미있게 SW·AI 융합 교육을 할 수 있는 플랫폼을 구현하였다. 플랫폼은 웹어셈블리 기반의 파이오다이드를 통해 웹 브라우저에서 파이썬 코딩을 가능하게 하고 복잡한 설치과정 없이 쉽게 이용이 가능하다. 다양한 LMS와 연동이 가능하도록 API를 제공하며, Drag & Fill 블록으로 입문자가 코딩에 겪는 어려움 중 하나인 많은 양의 함수와 파라미터 사용법의 어려움을 해소하였다. 플랫폼은 블록으로 코딩하여 문법의 어려움, 오탈자, 오류 등을 줄이는 동시에 블록에서 생성되는 파이썬 텍스트 코드로 입문자가 텍스트 코드에 익숙해질 수 있는 경험을 제공한다.

  • PDF

텍스트를 이미지화하기 위한 Interface 제작에 관한 연구 -작품 "Yesterday to Today"를 중심으로- (The Study of Making Interface for Text to Image)

  • 이우현;이성영;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 3부
    • /
    • pp.194-198
    • /
    • 2007
  • 본 연구의 주제는 텍스트를 어떻게 회화적이미지로 전환시킬 수 있을까?에 대한 것이다. 오늘날 디지털 환경 속에 있는 우리는 이미지 중심의 세계 속에 살고 있다. 과거 텍스트가 해왔던 정보의 생산과 전달 그리고 저장의 역할을 오늘날은 상당부분 이미지가 하게 되었다. 하지만 그럼에도 불구하고 아날로그 방식과 정서는 여전히 우리 곁에 남아있는 것도 사실이다. "Yesterday to Today"는 문자의 최소 단위인 알파벳을 통하여 이미지를 재현하려는 작품이다. 이 작품은 크게 두 가지 Idea로 이루어지는데 하나는 복수개의 실시간 영상 소스를 이용하여 이미지를 구성해내는 것과, 다른 하나는 텍스트에 의한 이미지의 변환이다. 복수개의 실시간 영상 소스는 프로그램이 작동하는 컴퓨터와 직/간접적으로 연결되어 전달되는데, 직접적으로 연결되어 근거리의 특정한 지점으로부터 영상 소스를 받을 수 있고, 또 하나의 방법은 인터넷을 통한하나 이상의 원거리 지점으로부터 보내어지는 영상을 조합하여 받을 수 있다. 프로그램 구현 개념은 픽셀 소스 카메라에서 캡쳐된 최초 이미지를 명도, 색상, 채도로 분류하고, 이것의 각각을 26개의 구간-자판의 개수에 의하여 정해짐-으로 나누고, 다시 그 각각의 구간을 26단계로 나눈다. 이렇게 나누어진 구간들은 알파벳과 1:1로 대응시켜 결과이미지의 해당 부분을 수치대로 재현하도록 프로그램 시킨다. 이미지의 부분들을 지정하기 위하여 특정한 텍스트로부터 알파벳의 빈도수를 조사했는데, 이 조사를 바탕으로 빈도수의 많고 적음에 따라 이미지부분들이 26개 구간으로 정해졌다. 이미지 재현 방법은 사용자가 모니터 위의 Result Image Cam을 통하여 얻고자 하는 이미지를 캡쳐한 후, 특정한 텍스트를 타이핑하면 이미지를 재현할 수 있는데, -입력된 텍스트의 알파벳은 프로그램이 지정한 HSI 컬러 모델의 영역과 1:1로 대응하게 하였다-이 이미지는 특정 장소에 실시간으로 받아진 영상을 데이터화 한 소스에 의하여 만들어진다. 이미지를 재현할 때 텍스트에 따라 알파벳 빈도수는 달라질 수 있으므로 비록 최초 이미지가 동일할지라도 얻고자하는 결과 이미지가 달라진다. 그러므로 사용자는다양한 창조적 경험을 할 수 있다.

  • PDF

고문헌의 디지털화에 관한 연구 (A Study on the Data Capturing of Oldbook)

  • 이지영;최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.183-186
    • /
    • 1997
  • 고문헌의 텍스트와 이미지를 디지털 방식으로 축적하여 제공하는 사례가 많아지고 있다. 전자화된 고문헌은 기존의 보존방안이었던 영인본이나 마이크로필름의 단점을 극복하고, 네트워크와 발달된 정보기술을 통해 매우 효율적인 정보이용수단을 제공할 수 있다. 본 연구에서는 영국 Electronic Beowulf와 한글과컴퓨터사의 삼국사기 CD 96의 사례를 분석하여 고문헌을 디지털 방식으로 축적하고자 할 때 고려해야 할 사항을 제시하고, 이렇게 축적된 정보자원이 어떻게 이용자의 정보요구를 충족시킬 수 있을지 활용방안을 논하고자 한다.

  • PDF

모양 기반의 식물 잎 이미지 인덱싱 (Shape-based Leaf Image Indexing)

  • 남윤영;손정민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.493-495
    • /
    • 2004
  • 최근, 디지털 카메라와 디지털 캠코더처럼 디지털 장비가 대중화됨에 따라, 이미지 데이터가 급증하게 되었다. 이와 함께, 이미지 검색에 대한 요구도 증가하게 되었으며, 단순한 텍스트 검색이 아닌 이미지의 특징에 기반한 검색이 요구되고 있다. 특징 기반의 검색은 색상, 질감, 모양 등과 같은 특성에 기반한 검색으로 사람이 일일이 주석을 입력하는 방식보다 자동화가 가능하며, 빠르게 인덱싱할 수 있는 장점이 있다. 본 연구에서는 모양을 이용하여 이미지를 인덱싱 하였으며, 스케치된 식물의 잎 모양의 이미지를 이용 하였다. 또한, 식물의 잎에 뻗어있는 잎맥의 모양을 이용하여 검색의 정확도를 높였다.

  • PDF

생성-선정을 통한 텍스트 증강 프레임워크 (TAGS: Text Augmentation with Generation and Selection)

  • 김경민;김동환;조성웅;오흥선;황명하
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.455-460
    • /
    • 2023
  • 텍스트 증강은 자연어처리 모델의 성능 향상을 목적으로 원본 텍스트의 변환, 생성을 통하여 새로운 증강 텍스트를 생성하는 방법론이다. 기존 연구된 기법들은 표현적 다양성 부족, 의미 왜곡 , 한정적인 양의 증강 텍스트와 같은 한계점이 존재한다. 거대언어모델과 few-shot learning을 활용한 텍스트 증강은 이러한 한계점의 극복이 가능하지만, 잘못된 생성으로 인한 노이즈 발생의 위험성이 존재한다. 본 논문에서는 여러 후보 텍스트를 생성하고 적합한 텍스트를 증강 텍스트로 선정하는 TAGS를 제안한다. TAGS는 기존 텍스트 few shot learning을 통해 다양한 표현을 생성하면서 대조 학습과 유사도 비교를 통해 원본 텍스트가 적더라도 적합한 데이터를 효과적으로 선정한다. 이를 텍스트 증강이 필수적인 업무용 챗봇 데이터에 적용하여 60배 이상의 양적 향상을 달성하였다. 또한 증강 텍스트의 질적 향상을 확인하기 위해 실제 생성된 텍스트를 분석하여 원본 텍스트에 비해 의미론적, 표현적으로 다양한 텍스트를 생성함을 확인하였으며, 증강 텍스트로 실제 분류 모델을 학습하고 실험하여 실질적으로 자연어처리 모델 성능 향상에 도움이 되는 것을 확인하였다.

Vertical Filter을 적용한 자동차번호판 자동추출 시스템설계 및 구현 (Implementation of Auto-Detection System and License Plates for Vertical Filter)

  • 홍유기;김장형
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.101-104
    • /
    • 2003
  • 본 논문은 개인용 휴대장비인 디지털카메라등을 통하여 차량의 앞/뒤 번호판을 자동인식하며 인식된 결과를 텍스트 형식으로 결과를 사용자에게 통보함은 물론, 입력된 차량의 정보를 부호화하고 통신망을 통하여 원격지 서버로 전달하고 원격지 서버는 복호화과정을 거쳐 전송된 텍스트 형태의 차량번호를 확인하여 차량에 대한 정보를 제공하는 시스템이다. 이는 급증하는 차량범죄 및 차량통제, 도난차량검거, 수배차량추적등 많은 분야에 효과적으로 사용이 가능하며 무선 및 도로교통에 많은 편의성과 효율성을 제고할 수 있다고 사료된다.

  • PDF

기획 / 유비쿼터스 시대와 전자출판

  • 이기성
    • 디지털콘텐츠
    • /
    • 9호통권124호
    • /
    • pp.42-47
    • /
    • 2003
  • 인간에게 문자가 탄생하고, 수백 년 아니 수천년의 종이책시대가 유지되다가, 1980년대에 디스크책이란 전자책이 출현하고, 1990년대에는 화면책이란 전자책이 출현했다.디스크책이나 네트워크에 연결된 화면책이나 둘 다 종이책이 아닌 비종이책이다. 비종이책은 종이책과 달리 저자의 의도를 텍스트라는 단일 매체만 사용해 시각화시키는 것이 아니다. 비종이책은 텍스트는 물론 음성과 동영상, 애니메이션을 동시에 사용할 수 있는 멀티미디어를 사용할 수 있는 것이다. 뉴미디어의 출현은 수십년이 됐다고 볼 수 있지만, 멀티미디어가 가능한 책의 출현은 20여년 정도밖에 안됐다고 본다. 종이가 대표하는 종이책 단일 매체 출판에 출판에 비해, 뉴미디어인 디스크나 네트워크를 사용하는 복합매체 출판으로 발전해온 역사는 아주 짧다.

  • PDF

텍스트 문서 영상 컨텐츠의 부활 (Revival of Text Document Image Contents)

  • 오일석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.96-102
    • /
    • 2003
  • 인류의 자식은 문서와 문서라는 형태를 통해 오랜세월 축적되어 왔다. 최근 컴퓨터 기술과 인터넷의 발전으로 인해 문서의 제작과 제공 패러다임이 아날로그 방식에서 디지털 방식으로 급속히 바뀌고 있다. 이러한 과정에서 기존 컨텐츠는 아날로그 형태로 존재하나 새로 발생하는 컨텐츠는 디지털 형태를 갖게되므로 존재 방식에 큰 간격이 발생하여 여러 문제를 야기할 수 있다. 이 논문은 텍스트 문서 영상 컨텐츠에 대해 이러한 간격을 줄이기 위한 방안을 고찰한다.

  • PDF

텍스트마이닝을 활용한 건설분야 트랜드 분석 (Analysis of trend in construction using textmining method)

  • 정철우;김재준
    • 한국디지털건축인테리어학회논문집
    • /
    • 제12권2호
    • /
    • pp.53-60
    • /
    • 2012
  • In this paper, we present new methods for identifying keywords for foresight topics that utilize the internet and textmining techniques to draw objective and quantified information that support experts' qualitative opinions and evaluations in foresight. Furthermore, by applying this fabricated procedure, we have derived keywords to analyze priorities in architectural engineering. Not much difference between qualitative methods of experts and quantitative methods such as text mining has been observed from comparison between technologies derived via qualitative method from "The Science Technology Vision" (control group). Therefore, as a quantitative tool useful for drawing keywords for foresight, textmining can supplement quantitative analysis by experts. In addition, depending on the level and type of raw data, text mining can bring better results in deriving foresight keywords. For this reason, research activities accommodating Internet search results and the development of textmining methods for analyzing current trends are in demand.