• 제목/요약/키워드: 과학 텍스트

검색결과 601건 처리시간 0.024초

압축된 써픽스 배열 구축의 실제적인 성능 비교 (Comparisons of Practical Performance for Constructing Compressed Suffix Arrays)

  • 박치성;김민환;이석환;권기룡;김동규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.169-175
    • /
    • 2007
  • 써픽스 배열은 기본적인 전체 텍스트 인덱스 자료구조로서, 반복되는 패턴 질의 수행 시 효율적으로 사용될 수 있다. 유용한 전체 텍스트 인덱스 자료구조들이 많이 제안되어왔음에도 불구하고, O(nlogn)-비트 공간을 필요로 하는 공통적인 문제점으로 인하여 보다 효율적으로 공간을 사용할 수 있는 방법에 대한 필요성이 요구되었다. 하지만 기 개발된 압축된 써픽스 배열이나 FM-인덱스와 같은 것들 또한 이미 존재하는 써픽스 배열에서부터 구축되어야 하기 때문에 실제적인 사용 공간을 줄일 수는 없었다. 최근, 써픽스 배열을 구축할 필요 없이 텍스트로부터 직접 압축된 써픽스 배열을 구축할 수 있는 두 가지 알고리즘들이 제안되었다. 본 논문에서는 실험을 통해 자료구조 구축 시간과 구축 시 필요로 하는 최대 사용 공간, 구축이 끝난 후 최종 자료구조의 크기 등을 측정함으로써 이 두 가지 압축된 써픽스 배열 구축 알고리즘과 기존의 써픽스 배열들과의 실제적인 성능을 비교한다.

웹 데이타베이스에서 하이퍼텍스트 모델 확장 및 데이타베이스 게이트웨이의 동적 서버 할당 (Hypertext Model Extension and Dynamic Server Allocation for Database Gateway in Web Database Systems)

  • 신판섭;김성완;임해철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권2호
    • /
    • pp.227-237
    • /
    • 2000
  • 웹 데이타베이스는 웹 환경에서 하이퍼텍스트 모델을 바탕으로 멀티미디어 처리를 위한 부가적인 구조와 관계형 또는 객체지향형 데이타베이스 관리 시스템을 접목하여 구축하는 대용량의 멀티미디어 데이타베이스 응용 시스템이다. 그러나 기존의 하이퍼텍스트 모델링 기법과 DBMS 통로 형태로는 웹 서비스 고급화에 필수적인 다양한 표현능력과 DBMS 연동과정에서의 병목발생으로 인한 동시성 기능이 제한된다. 따라서, 본 논문에서는 하이퍼텍스트 모델링 측면에서 암시적 질의 수행 기능을 지원하고 동적으로 생성되는 항해 모델과 가상 그래프 구조를 제안한다. 또한 항해 유형 분류를 통해 노드와 링크의 생성 규칙을 유도하고 제안된 모델과 웹 데이타베이스 시스템 후위에 위치하는 관계형 모델과의 상호 사상기법을 연구한다. 그리고 데이타베이스 통로의 효율을 향상시키기 위해 가중치를 기반으로 질의처리 서버를 동적으로 할당하는 스케줄링 기법을 제안하여 시스템 전체의 성능을 개선하고, 제안된 기법이 상대적으로 높은 복잡도를 갖는 동시 질의 요구에 적합함을 보인다.

  • PDF

LabVIEW를 사용한 텍스트/시각 프로그래밍 교육의 평가 지표 개발 및 유용성 분석 (A Development and Analysis of the Assessment Metrics for Text/Visual Programming Education Using LabVIEW)

  • 노영욱;정민포;조혁규;정덕길
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2544-2549
    • /
    • 2012
  • 컴퓨터 프로그래밍 교육은 컴퓨터과학 분야의 관련 전공과목을 공부하기 위하여 매우 중요할 뿐만 아니라, 학생들의 취업을 위한 기술 교육에서도 매우 중요하다. 이 논문에서는 컴퓨터 프로그래밍 교육에서 텍스트/시각 프로그래밍 교육을 적용하고 평가하기 위한 평가 지표를 개발한다. 또한, 학생들의 교육 및 취업에 적합한 프로그래밍 언어, 도구에 대한 타당성을 분석하여 프로그래밍 교육에 적합한 프로그래밍 언어/도구를 선택하고, 이에 대한 교육과정을 개발하여 프로그래밍 현장 교육에 적용하고 분석한다. 특히, 최근의 기술 추세와 산업계에 필요한 임베디드/모바일/웹 프로그래밍 분야에 널리 사용되고 있는 프로그래밍 분야에서 텍스트 기반 언어(JAVA)와 시각 프로그래밍 언어/환경(LabVIEW)에 대한 유용성을 비교하여 분석한다.

텍스트 마이닝 기법을 활용한 컴퓨팅 사고력 연구 동향 분석 (An Analysis of Research Trends in Computational Thinking using Text Mining Technique)

  • 이재호;장준형
    • 정보교육학회논문지
    • /
    • 제23권6호
    • /
    • pp.543-550
    • /
    • 2019
  • 컴퓨팅 사고력에 대한 연구는 2006년 자넷 윙이 이를 정의하고 2014년 영국에서 SW교육을 필수교과로 운영하게 되면서 관련 연구가 본격화 되었다. 본 연구는 최근 중요도가 높아가는 컴퓨팅 사고력을 키워드로 관련 연구논문을 수집하여 텍스트 마이닝 기법으로 분석하였다. 1차는 컴퓨팅 사고력을 키워드로 CONCOR 분석을 하였으며 2차는 국내외 대표 학술지를 선정하여 컴퓨팅 사고력의 구성요소를 텍스트 마이닝 기법으로 분석하였다. 2회에 걸친 분석결과 도출된 시사점은 다음과 같다. 첫째, 추상화, 알고리즘, 데이터처리, 문제분해, 패턴인식은 컴퓨팅 사고력 구성요소에 대한 연구의 핵심을 이루고 있었다. 둘째, 컴퓨팅 사고력과 과학, 수학 교과 중심의 융합 교육에 대한 연구가 활발히 진행되고 있음을 확인하였다. 셋째, 컴퓨팅 사고력에 대한 연구가 2010년 이후 확대되고 있었다. 향후 컴퓨팅 사고력과 구성요소에 대한 분류와 정의를 정립하여 이를 교육현장에 적용하는 연구가 꾸준히 진행되어야 할 필요가 있다.

텍스트 마이닝을 이용한 스마트 도시계획 수립을 위한 전략분야 도출연구: 부산 사례를 바탕으로 (Identification of Strategic Fields for Developing Smart City in Busan Using Text Mining)

  • 채윤식;이상훈
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.1-15
    • /
    • 2018
  • 본 연구의 목적은 텍스트 마이닝 기법을 활용하여 부산 및 기타 지자체의 도시계획 보고서에 포함되어 있는 서지정보를 분석하고 새로운 스마트도시계획의 수립을 위한 전략 분야를 도출하는 것이다. 텍스트 마이닝 분석은 구조화되어 있지 않은 문서로부터 키워드를 추출하고 획득한 정보의 특성과 패턴을 발견하는 기법으로 최근 지식관리 측면에서 많이 사용되고 있다. 본 분석을 통해 초기의 부산 도시계획은 개별 산업분야 고도화에 초점이 맞춰져 있을 뿐 각 분야별 정보시스템의 연계에 대한 논의가 적은 것으로 나타났지만 최근 계획에서는 도시통합운영관리와 관련한 물리적 인프라와 ICT시스템과 관련한 내용이 다수 포함되어있는 것으로 나타났다. 특히, 타 지자체에 비해 항만/물류, 문화, 전시 분야가 특유의 서비스영역으로 도출되었지만 도시안전, 데이터공유, 신재생에너지 분야에 대한 계획은 부족한 것으로 나타났다. 본 연구는 향후 새로운 스마트 도시계획 수립을 위한 정책적 시사점을 제공할 것으로 기대한다.

공문서의 기계가독형(Machine Readable) 전환 방법 제언 (Suggestions on how to convert official documents to Machine Readable)

  • 임진희
    • 기록학연구
    • /
    • 제67호
    • /
    • pp.99-138
    • /
    • 2021
  • 빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유 중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다. 이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.

텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 소비자의 의복 맞음새(Fit)평가에 영향을 미치는 특성 (Using Text Mining and Social Network Analysis to Identify Determinant Characteristics Affecting Consumers' Evaluation of Clothing Fit)

  • 황수현;박주연
    • 감성과학
    • /
    • 제26권1호
    • /
    • pp.101-114
    • /
    • 2023
  • 본 연구의 목적은 텍스트 마이닝과 소셜 네트워크 분석을 활용한 소비자 맞음새 평가의 주요 특징을 규명하는 것이다. 이를 위해 SNS에서 수집된 소비자의 2,000여건의 의복 맞음새 평가 후기로부터 의복 맞음새 관련된 텍스트 데이터를 추출하고 의미연결망 분석과 CONCOR 분석을 수행하였다. 연구 결과, '팬츠'와 '스커트'가 많은 맞음새평가어를 공유하며 다양한 형태로 평가되는 것을 확인하였고 의복의 길이가 가장 많이 평가되었다. 인체부위 중 '허리'는 다양한 의복의 맞음새를 평가하는 가장 중요한 부분이며 의복 맞음새평가어 중 '넓은', '큰', '와이드한', '긴' 등이 가장 많이 사용되는 것으로 나타났다. 본 연구는 소비자 맞음새 평가에 사용된 언어의 구조적 관계와 의미를 구체적으로 규명하고 의복 맞음새의 향상을 위한 실증적 기초 자료를 제공하는데 의의가 있다.

국가R&D과제와 신문에서 텍스트마이닝을 통한 그래핀 기술의 지식구조 탐색 (Discovering the Knowledge Structure of Graphene Technology by Text Mining National R&D Projects and Newspapers)

  • 이지연;나혜인;이병희;김태현
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.85-99
    • /
    • 2021
  • '꿈의 소재'로 불리는 그래핀이 4차 산업혁명 시대를 선도할 획기적인 신소재로 주목받고 있다. 그래핀은 높은 강도와 탁월한 전기 및 열 전도율, 뛰어난 광학적 투과도, 우수한 기체 차단 등 특성을 지닌다. 본 논문에서는 최근 우리 정부의 그린 및 디지털 뉴딜 정책과 코로나19 팬데믹 관련 바이오센서로도 주목받는 그래핀 기술을 분석해 국가 R&D 동향과 지식구조를 파악하고 활용 가능성을 모색한다. 이를 위해 우리나라 국가과학기술지식정보서비스에서 최근 10년간의 국가R&D 과제정보 4,054건을 수집해 그래핀 관련 과제정보 동향을 분석한다. 또 이 가운데 정부의 그린뉴딜 정책과 관련된 녹색기술분류에 해당하는 과제도 함께 분석한다. 이와 더불어 국내 전문지 e신문에서 최근 500건의 그래핀 관련 기사를 수집해 텍스트마이닝 분석을 수행한다. 이러한 국가R&D 과제정보 및 신문기사를 분석한 결과 그래핀을 소재로 한 국가 전체 R&D과제 중 과제 수가 가장 많은 분야가 고효율 2차전지기술로 나타났고, 전체 연구비에서 차지하는 비중도 1위로 가장 높았다. 이번 연구결과를 통해 향후 우리나라가 그래핀 기술개발을 선도해 전기자동차는 물론이고 휴대폰 배터리, 차세대 반도체, 5G 및 바이오센서 분야 등 전 산업군에서 세계적인 선도국으로 도약하기를 기대한다.

소셜 빅데이터 분석을 통해 알아본 대중의 과학관에 대한 인식 및 사용 행태 (Public Perception and Usage Pattern of Science Museum by Social Media Big Data Analysis)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권6호
    • /
    • pp.1005-1014
    • /
    • 2017
  • 본 연구는 대중의 과학적 소양을 함양하기 위한 기관으로서의 과학관의 역할에 주목하고, 우리나라 과학관이 대중에게 어느 정도 영향을 미치고 있는지 알아보기 위하여 소셜 빅데이터 분석을 통해 대중의 과학관에 대한 인식과 사용 행태를 알아보고자 하였다. 이를 위해 네이버 블로그와 트위터에에서 '과학관'이 포함된 게시글들을 추출한 뒤 텍스트 네트워크 분석, 빈도 분석, 공기어 분석 및 의미 분석을 실시하고 영어권의 분석 결과와 비교해 보았다. 그 결과 블로그에서는 주로 어린 자녀를 둔 부모 층에서 과학관이 이슈가 되고 있었고, 트위터에서는 단체 관람을 하는 학생 층이 다수 드러났다. 따라서 우리나라 대중들은 과학관을 주로 아이의 체험을 위한 공간으로 활용하고 있었고, 이 경우 과학관의 프로그램과 전시에 대해서는 긍정적으로 인식하고 있었다. 한편 단체 관람하는 학생들은 다소 부정적 감정을 표출하고 있는 것으로 나타났다. 과학관과 대중과의 소통, 대중의 과학에 대한 참여 등 제 3세대적 과학관의 기능적 측면에서 외국의 사례와 비교해본 결과 우리나라 대중들은 과학관 관람 이후 관람한 과학적 내용에 대한 언급이 거의 없었고, 논쟁이나 심포지움 등 과학적 의사소통과 관련된 언급 역시 거의 없었다. 또한 해설사나 직원들도 외국과는 달리 전혀 회자되지 않고 있었다. 한편, 영어권 게시글의 동사 분석에서 '배우다', '참여하다', '듣다', '읽다', '묻다', '생각하다', '그리다' 등의 유의미한 활동과 관련된 동사들이 다수 나타난 것에 비해 우리나라 게시글에서는 '물어보다', '생각하다' 가 소수 나타나는 것에 그치고 있었다. 따라서 과학관은 과학관 관람객들이 관람을 마친 뒤에 그들의 기억에 남고 대중들 사이에서 회자될 만큼 영향력 있고 다양한 내용과 활동이 일어날 수 있도록 개선할 필요가 있겠다.

내용 기반 이미지 검색을 위한 복합 질의문 계획 생성 기법 (Generating Combined Query Plan for Content-Based Image Retrieval)

  • 박미화;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.562-571
    • /
    • 2000
  • 이미지 데이터는 텍스트 데이터와는 달리 다양한 색상과 모양, 질감과 같은 비정형적인 특징을 가진다. 따라서 이미지 데이터베이스는 텍스트 기반의 전통 데이터베이스와는 다른 모델링 방법과 질의, 검색 방법을 사용한. 특히, 내용 기반 이미지 검색에서의 검색 속도와 정확도를 향상시키기 위해서는 새로운 복합 질의문 계획 생성 기법이 필요하다. 본 논문에서는 이를 위해 먼저, 단일 조건을 갖는 시각 질의에 대한 처리 기법들을 토대로 여러 조건을 갖는 복합 질의를 처리하기 위한 복합 질의문 계획 생성기법인 SSCC(Similarity Search for Conjunction Combination Query) 알고리즘을 제안한다. SSCC는 이미지 데이터베이스 검색 시스템에서 복합 질의를 처리하기 위한 질의 최적화 과정에서 질의 수행 시간과 투플 I/O를 최소화하는 질의문 계획을 생성하기 위해 사용된다. SSCC 알고리즘은 복합질의를 단일 질의들로 준해하고 퍼지 집합 이론을 도입하여 단일 질의의 결과들을 통합한다. 논문에서 연구된 내용 기반 복합 질의문 계획 생성 기법은 특정 이미지 영역에 국한되지 않으며 다양한 종류의 시각 질의를 수행하기 위한 효율적인 질의문 계획 생성 기법으로 사용될 수 있다.

  • PDF