• 제목/요약/키워드: Semantic Expansion

검색결과 72건 처리시간 0.029초

자율성장 인공지능 기술 (Self-Improving Artificial Intelligence Technology)

  • 송화전;김현우;정의석;오성찬;이전우;강동오;정준영;이윤근
    • 전자통신동향분석
    • /
    • 제34권4호
    • /
    • pp.43-54
    • /
    • 2019
  • Currently, a majority of artificial intelligence is used to secure big data; however, it is concentrated in a few of major companies. Therefore, automatic data augmentation and efficient learning algorithms for small-scale data will become key elements in future artificial intelligence competitiveness. In addition, it is necessary to develop a technique to learn meanings, correlations, and time-related associations of complex modal knowledge similar to that in humans and expand and transfer semantic prediction/knowledge inference about unknown data. To this end, a neural memory model, which imitates how knowledge in the human brain is processed, needs to be developed to enable knowledge expansion through modality cooperative learning. Moreover, declarative and procedural knowledge in the memory model must also be self-developed through human interaction. In this paper, we reviewed this essential methodology and briefly described achievements that have been made so far.

TF-IDF를 활용한 한글 자연어 처리 연구 (A study on Korean language processing using TF-IDF)

  • 이종화;이문봉;김종원
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제28권3호
    • /
    • pp.105-121
    • /
    • 2019
  • Purpose One of the reasons for the expansion of information systems in the enterprise is the increased efficiency of data analysis. In particular, the rapidly increasing data types which are complex and unstructured such as video, voice, images, and conversations in and out of social networks. The purpose of this study is the customer needs analysis from customer voices, ie, text data, in the web environment.. Design/methodology/approach As previous study results, the word frequency of the sentence is extracted as a word that interprets the sentence has better affects than frequency analysis. In this study, we applied the TF-IDF method, which extracts important keywords in real sentences, not the TF method, which is a word extraction technique that expresses sentences with simple frequency only, in Korean language research. We visualized the two techniques by cluster analysis and describe the difference. Findings TF technique and TF-IDF technique are applied for Korean natural language processing, the research showed the value from frequency analysis technique to semantic analysis and it is expected to change the technique by Korean language processing researcher.

치과진료실에서 수행되는 치과진료 협조업무에 대한 질적연구 - 간호조무사를 중심으로 - (A qualitative study on dental clinical assistance work performed in dental clinics - Focusing on nursing assistant -)

  • 홍선화;문상은;서가혜
    • 한국치위생학회지
    • /
    • 제22권6호
    • /
    • pp.563-572
    • /
    • 2022
  • Objectives: The purpose of this study is to provide basic data for elucidating the clinical experiences of nursing assistants working at dental clinics and for establishing the bases necessary for building a safe working environment for the staff at dental clinics. Methods: From March 28 to August 20, 2022, the study conducted in-depth interviews with nursing assistants working with dental hygienists in dental clinics. The collected data were analyzed using the phenomenological method. Results: The study analyzed the meanings associated with the dental clinical assistance work experiences of nursing assistants in dental clinics. A total of 98 semantic words and 9 sub-categories were extracted, which were ultimately categorized into 4 central meanings: 'imperfect reality', 'work without boundaries', 'putting oneself in someone else's shoes', and 'symbiosis'. Conclusions: The nursing assistants were exposed to an environment where they needed to perform delegated treatment procedures even when they lacked dental work competency. They recognized their gaps in learning and the necessity for designated roles as clinical assistants. Thus, it is necessary to review the allocation and expansion of the work roles of dental practitioners based on the practical and rational realities in dental practice.

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.

한국고고학 디지털 사전 구축 방안 연구 (Approaches to Creating a Digital Encyclopedia of Korean Archaeology)

  • 이초롱
    • 헤리티지:역사와 과학
    • /
    • 제56권2호
    • /
    • pp.28-45
    • /
    • 2023
  • 디지털 대전환 시대를 맞이했지만 문화유적 조사 결과 생산되는 수많은 고고 디지털 원천 자료를 효율적으로 수집·관리·통합·서비스할 수 있는 활용체계, 즉 고고학술정보의 지능형 통합관리·서비스 플랫폼은 부재한 상황이다. 이와 관련하여, 현재 웹에서 PDF형태로 서비스되고 있는 한국고고학사전의 단순 전산화(Digitization) 문제와 한국고고학사전 발간 및 활용 현황 등을 통해 '한국고고학 디지털 사전 구축' 필요성을 확인하였다. 이에 본 연구에서는 자료 접근의 한계와 어려움에 따른 고고학술 데이터 접근성 제고와 고품질의 지식정보 제공을 중심으로 한 '한국고고학 디지털 사전 구축'의 전반적인 방향을 제안하였다. 2001년부터 발간하고 있는 한국고고학사전의 활용 현황을 분석하여 디지털 전환의 필요성을 확인하였고, 유럽, 미국, 일본 등 국외 고고학 데이터 아카이빙 플랫폼과 국내 전문사전과 관련한 플랫폼 구축 사례를 검토하여 데이터의 체계적인 관리와 보존, 활용에 대해 살펴보았다. 이를 통해 '한국고고학 디지털 사전 구축'을 위한 실행 과제로서 전산화된 기록물에 대한 메타데이터 설계와 생산된 메타데이터 간의 관계 정보를 부여하고 보여주는 시맨틱(semantic, 의미 기반) 데이터로의 확장 등을 제안하였다. 이러한 연구를 바탕으로 향후 고고학술정보의 지능형 통합관리·서비스 플랫폼 구축과 이에 따른 한국고고학에 대한 대중의 관심과 이해를 한 단계 높일 수 있는 발판을 마련하는 계기가 될 것으로 기대한다.

일반 고등학교 기술과 교육과정 편성·운영 사례 연구 (Case study of organization and operation expansion in General high school technology course)

  • 임윤진
    • 대한공업교육학회지
    • /
    • 제43권2호
    • /
    • pp.97-113
    • /
    • 2018
  • 이 연구는 일반 고등학교의 기술과 교육과정의 편성 운영의 사례를 찾아 그 과정과 의미를 분석한 연구이다. 이를 위하여 사례연구방법의 절차에 따라 연구문제를 설정하고, 연구에 적합한 사례를 발굴하여 해당 학교의 교사와 서면인터뷰를 통해 자료를 수집하였다. 연구에 활용된 사례는 경기도의 2개 고등학교이며, 수집된 자료는 의미 분석 과정을 통하여 개념 형태로 시각화하였다. 두 학교의 사례를 종합한 결론을 제시하면 다음과 같다. 첫째, 교사가 당면한 위기의식을 도전과 협업을 통하여 단위학교 교육과정을 개정하였다. 둘째, 2015 개정 교육과정에서 제시된 자유 수강제도를 이용할 필요가 있다. 셋째, 고등학교 수준에 맞는 다양한 기술과 교육활동을 통하여 수업을 내실화하여 학생 및 교육과정 관계자들의 인식을 전환해야 한다. 넷째, 기술교사로서 전문성 신장을 위하여 지속적인 노력이 요구된다. 일반 고등학교의 기술과 교사는 교당 1명 정도로 학교의 교육과정 편성 운영 및 이에 대한 확대 개정이 어려운 실정이지만, 이 연구의 사례 등을 통하여 고교학점제에서 지향하는 진로선택을 위한 다양한 교육활동으로서 기술교과의 중요성과 인식전환이 이루어지길 기대한다.

의미 정보를 이용한 이단계 단문분할 (Two-Level Clausal Segmentation using Sense Information)

  • 박현재;우요섭
    • 한국정보처리학회논문지
    • /
    • 제7권9호
    • /
    • pp.2876-2884
    • /
    • 2000
  • 단문분할은 한 문장에 용언이 복수개 있을 때 용언을 중심으로 문장을 나누는 방법이다. 기존의 방법은 정형화된 문장의 경우 비교적 효율적인 결과를 얻을 수 있으나, 구문적으로 복잡한 문장인 경우는 한계를 보였다. 본 논문에서는 이러한 한계를 극복하기 위해서 구문 정보만이 아니라, 의미 정보를 활용하여 단문을 분할하는 방법을 제안한다. 정형화된 문장의 경우와 달리 일상적인 문장은 무장 구조의 모호성이나 조사의 생략 등이 빈번하므로 의미 수준에서의 단문분할이 필요하다. 의미 영역에서 단문분할을 하면 기존의 구문 의존적인 방법들에서 발생하는 모호성을 상당수 해소할 수 있게 된다. 논문에서는 먼저 하위범주와 사전과 시소러스의 의미 정보를 이용하여 용언과 보어성분 간의 의존구조를 우선적으로 파악하고, 구문적인 정보와 기타 문법적인 지식을 사용하여 기타 성분을 의존구조에 점진적으로 포함시켜가는 이단계 단문분할 알고리즘을 제안한다. 제안된 이단계 단문분할 방법의 유용성을 보이기 위해 ETRI-KONAN의 말뭉치 중 25,000문장을 수작업으로 술어와 보어성분 간의 의존구조를 태깅한 후 본 논문에서 제안한 방법과 비교하는 실험을 수행하였으며, 이때 단문분할의 결과는 91.8%의 정확성을 보였다.

  • PDF

표상성을 중심으로한 공간 이미지화에 관한 연구 (A Study of imagification of space laying emphasis on representation)

  • 황용섭;박찬호
    • 한국실내디자인학회논문집
    • /
    • 제14권5호
    • /
    • pp.106-113
    • /
    • 2005
  • New images percolate through human consciousness by the media such as movies, TV programs, and brilliant advertisements. These images reproduce new ' things ' throughout the ' semantic processes ' by those who experience and recognize them. Alvin Toffler describes it as the ' information bomb ' and ' image fragments ' in his talk about the new paradigm of information-oriented era. The increasing number of images and their accelerating rate of appearance imply that images become more momentary, and are evidence that they are transforming entire human life and consciousness. Such awareness means a lot to a designer. Especially, the subject that how modern space-dominating images are related to the structure and materials constituting the space and communicate with human mind will be an important factor in establishing the human-space relationship in the future. Furthermore, the present age overspread with various medium is not the only one privileged of the images that exist within space. They are the results of continuous expansion of existing images, and also process of evolution of space powered by the fusion of images and digital media. Imagified space is a boundary layer of Cyberspace, and the space itself becomes an interface by human recognition and participation. Now, the functional classification of spaces such as ' office, ' ' cafe, ' and ' school ' is meaningless. Whatever it may be, the function of a space is defined by the information it interfaces, and therefore it becomes an interface to information through a large number of images. Based on this idea, we will observe the imagificaiton of space in the form of discussion, and from that, try to understand the phenomenon through the real world examples.

빅 데이터 환경에서 계층적 문서 유형 분류를 위한 클러스터링 기반 다중 SVM 모델 (Multi-class Support Vector Machines Model Based Clustering for Hierarchical Document Categorization in Big Data Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.600-608
    • /
    • 2017
  • 최근 인터넷의 급격한 확장에 따른 정보의 양이 기하급수적으로 증가하고 있다. 그러나 실제 사용자에게 필요한 정보는 극히 일부분으로 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 따라서 검색어로 검색된 문서에 대한 유사도 평가를 통한 계층적 유사 정보와 검색 우선순위에 대한 정보를 제공할 필요성이 있다. 이를 위해서 검색어를 구성하고 있는 키워드의 동시 발생 빈도를 고려한 검색 문서에 대한 유사도를 기반으로 문서 클러스터를 구성하고 SVM을 적용한 빅 데이터 기반 계층적 유형 분류 모델을 제안한다. 계층적 분류방법과 SVM 분류기의 결합은 문서의 계층이 기하급수적으로 늘어나는 웹 문서의 경우에 높은 성능을 얻을 수 있다. 제안된 모델은 정확하고 신속한 검색을 제공하는 정보검색시스템의 응용 모델로 활용될 수 있다.

XBRL이 전자공시 시스템에 미치는 영향 (The Effect of Disclosure System through XBRL)

  • 신승중;김정일;이태훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.229-234
    • /
    • 2008
  • XBRL은 기본적으로 XBRL 한국지부에서 개발한 KGAAP 2.1을 기반으로 기업들이 확장하는 구조로 정의되어 있다. 각 기업은 Taxonomy에서 자신의 업종을 선택하고 각 기업에 맞는 태그들을 확인하여 추가하여야 한다. 문서작성은 태그를 확장하는 등 복잡한 부분이 존재하여 태그확장, 데이터 입력의 단계를 거쳐서 작성해야 하는 어려움이 있다. 스타일의 표현방법은 XBRL기본적으로 제공하는 Presentation구조와 Label구조를 이용하여 표준을 제공하지만, XBRL Processor을 이용해야 하는 복잡한 문제가 있다. 금감원 (Financial Supervisory Service) (DART), 증권선물거래소(Korea Exchange)(KIND, KEDIS)의 전자공시 시스템은 SGML, XML, XBRL의Markup Language을 서식언어로 사용하고 있다. 각 언어의 특성에 따라 문서 정의 절차와 처리 방식이 다르게 나타난다. 본 논문에서는 각 전자공시 시스템의 서식언어에 따른 단계별 영향을 분석하고, 서식언어의 방향에 대해 연구한다.

  • PDF