• Title/Summary/Keyword: 텍스트형

Search Result 432, Processing Time 0.023 seconds

A Study on the Evaluation of LLM's Gameplay Capabilities in Interactive Text-Based Games (대화형 텍스트 기반 게임에서 LLM의 게임플레이 기능 평가에 관한 연구)

  • Dongcheul Lee
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.24 no.3
    • /
    • pp.87-94
    • /
    • 2024
  • We investigated the feasibility of utilizing Large Language Models (LLMs) to perform text-based games without training on game data in advance. We adopted ChatGPT-3.5 and its state-of-the-art, ChatGPT-4, as the systems that implemented LLM. In addition, we added the persistent memory feature proposed in this paper to ChatGPT-4 to create three game player agents. We used Zork, one of the most famous text-based games, to see if the agents could navigate through complex locations, gather information, and solve puzzles. The results showed that the agent with persistent memory had the widest range of exploration and the best score among the three agents. However, all three agents were limited in solving puzzles, indicating that LLM is vulnerable to problems that require multi-level reasoning. Nevertheless, the proposed agent was still able to visit 37.3% of the total locations and collect all the items in the locations it visited, demonstrating the potential of LLM.

Analysis of accident types at small and medium-sized construction sites based on web scraping and text mining (웹 스크래핑 및 텍스트마이닝에 기반한 중소규모 건설현장 사고유형 분석)

  • Younggeun Yoon
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.1
    • /
    • pp.609-615
    • /
    • 2024
  • The construction industry's fatality count stands at 402, comprising approximately 46% of total industrial accidents. Notably, construction costs less than 5 billion won account for about 69%, so strengthening safety management at small and medium-sized construction sites is required. In this study, 19,511 accident investigation data were collected using web scraping. Through statistical analysis of the collected structured data and text mining analysis of the unstructured data, accident types and causes of accidents were analyzed by construction costs at sites less than 5 billion won. As a result, it was confirmed that there were differences in accident types and causes depending on the construction costs. It is hoped that the results of this study will be used for customized safety management at small and medium-sized construction sites.

Ubiquitous Healthcare Protocol Description from Physician-centered to Participants-centered (의사-중심으로부터 참여자-중심의 유비쿼터스 헬스케어 프로토콜 기술)

  • Hwang, Gyeong-Sun;Lee, Seon-A;Lee, Geon-Myeong;Kim, Won-Jae;Yun, Seok-Jung;Ha, Yun-Seok
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.11a
    • /
    • pp.153-156
    • /
    • 2007
  • 임상 프로토콜은 의료 서비스의 질을 향상시키는데 매우 중요한 수단 중 하나이다. 하지만 대부분의 임상 프로토콜이 텍스트 기반으로 되어 있을 뿐만 아니라 텍스트 기반의 임상 프로토콜들이 실행 가능한 형태로 시스템화가 되었더라도 치료를 하는 전문의의 관점에서만 기술되어 왔다. 한편 최근의 임상 연구는 유비쿼터스 헬스케어 서비스를 이용한 환자 개인의 맞춤형 의료서비스에 관한 연구가 진행되고 있다. 이와 같은 유비쿼터스 헬스케어 환경에서는 환자가 병원에서 뿐만 아니라 시간과 장소의 제약을 받지 않고 휴대용 단말기나 진단기기를 이용하여 효과적으로 의료 서비스를 제공 받을 수 있기 때문에 전문의뿐만 아니라 환자와 시스템도 헬스케어에 참여를 하게 된다. 따라서 전문의 중심의 임상 프로토콜 기술로부터 참여자 중심의 임상 프로토콜 기술이 절실히 요구된다. 본 논문에서는 전문의, 환자, 그리고 시스템의 역할에 따라 프로토콜 상에서 수행되어야 할 태스크들과 참여자들의 상태정보를 태스크 튜플 형태로 표현하였다. 하지만 태스크 튜플 기반의 표현 방법은 임상 프로토콜올 직관적으로 이해하는 데는 한계 있어 이러한 단점을 보완한 패트리 넷 기반의 유비쿼터스 헬스케어 프로토콜 기술 방법을 제안한다.

  • PDF

Text Detection in Scene Images using spatial frequency (공간주파수를 이용한 장면영상에서 텍스트 검출)

  • Sin, Bong-Kee;Kim, Seon-Kyu
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.1_2
    • /
    • pp.31-39
    • /
    • 2003
  • It is often assumed that text regions in images are characterized by some distinctive or characteristic spatial frequencies. This feature is highly intuitive, and thus appealing as much. We propose a method of detecting horizontal texts in natural scene images. It is based on the use of two features that can be employed separately or in succession: the frequency of edge pixels across vertical and horizontal scan lines, and the fundamental frequency in the Fourier domain. We confirmed that the frequency features are language independent. Also addressed is the detection of quadrilaterals or approximate rectangles using Hough transform. Since texts that is meaningful to many viewers usually appear within rectangles with colors in high contrast to the background. Hence it is natural to assume the detection rectangles may be helpful for locating desired texts correctly in natural outdoor scene images.

LM Clustering based Dynamic LM Interpolation for ASR N-best Rescoring (언어모델 군집화와 동적 언어모델 보간을 통한 음성인식 성능 향상)

  • Chung, Euisok;Jeon, Hyung-Bae;Jung, Ho-Young;Park, Jeon-Gue
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.240-245
    • /
    • 2015
  • 일반영역 음성인식은 n-gram 희소성 문제로 인해 대용량의 언어모델이 필요하다. 대용량 언어모델은 분산형 모델로 구현될 수 있고, 사용자 입력에 대한 동적 언어모델 보간 기술을 통해 음성인식 성능을 개선할 수 있다. 본 논문은 동적 언어모델 보간 기술에 대한 새로운 접근방법을 시도한다. 텍스트 군집화를 통해 주제별 언어모델을 생성한다. 여기서 주제는 사용자 입력 영역에 대응한다. 본 논문은 사용자 입력에 대하여 실시간으로 주제별 언어모델의 보간 가중치 값을 계산하는 접근 방법을 제시한다. 또한 언어모델의 보간 가중치 값 계산의 부담을 감소하기 위해 언어모델 군집화를 통해 대용량 언어모델 보간 접근 방법의 연산 부담을 해소하기 위한 시도를 한다. 주제별 언어모델에 기반하고 언어모델 군집화를 통한 동적 언어모델 보간 기술의 실험 결과 음성인식 오류 감소율 6.89%를 달성했다. 또한 언어모델 군집화 기술은 음성인식 정확도를 0.09% 저하시켰을 때 실행 시간을 17.6% 개선시키는 실험결과를 보였다.

  • PDF

Analysis of response to transportation policy for particulate matter reduction using regression analysis and text mining (미세먼지 감축을 위해 회귀분석과 텍스트 마이닝을 활용한 교통 정책에 대한 반응 분석)

  • Kim, Annie;Jeong, So Hee;Choi, Hyun Bin;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.277-280
    • /
    • 2018
  • 최근 서울시에서는 '미세먼지 비상저감조치'로 '대중교통 무료' 정책을 시행하고 후속 조치로 '시민 참여형 차량 2 부제'를 제안하였다. 본 논문에서는 먼저, 위 두 교통 정책의 실효성을 파악하기 위해 '교통'을 중심으로 각 산업이 미세먼지에 미치는 영향을 알아보고, 위 정책들에 대한 시민들의 반응을 분석한다. 각 산업이 미세먼지에 미치는 영향은 회귀분석으로, 두 정책에 대한 시민들의 반응은 텍스트 마이닝 기법을 통해 알아보았다. 그 결과, 교통수단의 도로 이용 여부에 따라 미세먼지에 미치는 영향력의 정도와 방향이 다름을 알 수 있었고 정책에 대한 관심과 부정적인 의견이 크게 증가함을 알 수 있었다. 또 국외 요인에 대한 해결책도 필요로 함을 알 수 있었다. 마지막으로 위 결과를 토대로 향후 미세먼지 문제와 관련된 정책이 나아갈 방향을 제시한다.

Deep learning-based custom problem recommendation algorithm to improve learning rate (학습률 향상을 위한 딥러닝 기반 맞춤형 문제 추천 알고리즘)

  • Lim, Min-Ah;Hwang, Seung-Yeon;Kim, Jeong-Jun
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.22 no.5
    • /
    • pp.171-176
    • /
    • 2022
  • With the recent development of deep learning technology, the areas of recommendation systems have also diversified. This paper studied algorithms to improve the learning rate and studied the significance results according to words through comparison with the performance characteristics of the Word2Vec model. The problem recommendation algorithm was implemented with the values expressed through the reflection of meaning and similarity test between texts, which are characteristics of the Word2Vec model. Through Word2Vec's learning results, problem recommendations were conducted using text similarity values, and problems with high similarity can be recommended. In the experimental process, it was seen that the accuracy decreased with the quantitative amount of data, and it was confirmed that the larger the amount of data in the data set, the higher the accuracy.

A Study on Identifying Personal Information on Conversational Text Data (대화형 텍스트 데이터 내 개인정보 식별에 대한 연구)

  • Cha, Do Hyun;Kown, Bo Keun;Youn, Hee Chang;Lee, Gu Hyup;Joo, Jong Wha J.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.11-13
    • /
    • 2022
  • 데이터 3 법을 필두로, 기업은 개인정보가 포함된 데이터를 활용하기 위해 비식별 처리가 필요하게 되었다. 기존 방식은, 비정형 텍스트 데이터에서 정규표현식을 통한 개인정보 식별은 데이터의 다양성에 의해 한계가 명확하며, 기존의 Named Entity Recognition(NER) 태스크로 해결하기에는 언어의 중의적 표현과 2 인 대화에서 나타나는 개인정보가 누구의 것인지 판단하지 못한다는 한계가 존재한다. 따라서 우리는 기존의 한계점을 극복하고 개선하기 위해 BERT 언어 모델에 화자 정보를 학습시키고, 하나의 어절에 2 개의 tag 를 labeling 하는 방법을 제안하여 정확한 개인정보 식별을 시도하였다.

A Study on Contents-based Retrieval using Wavelet (Wavelet을 이용한 내용기반 검색에 관한 연구)

  • 강진석;박재필;나인호;최연성;김장형
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.4 no.5
    • /
    • pp.1051-1066
    • /
    • 2000
  • According to the recent advances of digital encoding technologies and computing power, large amounts of multimedia informations such as image, graphic, audio and video are fully used in multimedia systems through Internet. By this, diverse retrieval mechanisms are required for users to search dedicated informations stored in multimedia systems, and especially it is preferred to use contents-based retrieval method rather than text-type keyword retrieval method. In this paper, we propose a new contents-based indexing and searching algorithm which aims to get both high efficiency and high retrieval performance. To achieve these objectives, firstly the proposed algorithm classifies images by a pre-processing process of edge extraction, range division, and multiple filtering, and secondly it searches the target images using spatial and textural characteristics of colors, which are extracted from the previous process, in a image. In addition, we describe the simulation results of search requests and retrieval outputs for several images of company's trade-mark using the proposed contents-based retrieval algorithm based on wavelet.

  • PDF

Ontology based Retrieval System for Cultural Assets Using Hybrid Text-Sketch Queries (혼합형 질의 방법에 의한 온톨로지 기반 유물 검색 시스템)

  • Cheon Hyeon-Jae;Baek Seung-Jae;Lee Hong-Chul
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.5 s.37
    • /
    • pp.17-26
    • /
    • 2005
  • With the rapidly Slowing information, the research on the effcient information retrieval is increasing. Most of the retrieval systems for domestic cultural assets on the web have adopted a keyword-based search method. Those systems have required users to know the exact information about cultural assets such as name, keyword, etc. However, it is not easy to search the cultural assets with little information or only a remembrance of the shape. In this paper, we propose the retrieval system for cultural assets using both ontology-based and sketch-based search method to solve the Problems of existing systems. Our retrieval system allows users to use both text and sketch for a Query regardless of the type of information about cultural assets and to search in results using the ontology.

  • PDF