• 제목/요약/키워드: Open AI

검색결과 280건 처리시간 0.024초

빅데이터 처리 기술을 활용한 비정형데이터 분석 모델링 구축 (Building Modeling for Unstructured Data Analysis Using Big Data Processing Technology)

  • 김정훈;김성진;권기열;주다혜;오재용;이준동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.253-255
    • /
    • 2020
  • 기업 및 기관 데이터는 워드프로세서, 프레젠테이션, 이메일, open api, 엑셀, XML, JSON 등과 같은 텍스트 기반의 비정형 데이터로 구성되어 있습니다. 텍스트 마이닝(Textmining)을 통해서 자연어 처리 및 기계학습 등의 기술을 이용하여 정보의 추출부터 요약·분류·군집·연관도 분석 등의 과정을 수행울 진행한다. 다양한 시각화 데이터를 보여줄 수 있는 다양한 모델 구축을 진행한 후 민원 신청 내용을 분석 및 변환 작업을 진행한다. 본 논문은 AI 기술과 빅데이터를 활용하여 민원을 분석을 하여 알맞은 부서에 민원을 자동으로 할당해 주는 기술을 다룬다.

  • PDF

세션 키 동의를 제공하는 상호인증 패스워드 인증 스킴에 대한 취약점 공격 (Vulnerability Attack for Mutual Password Authentication Scheme with Session Key agreement)

  • 서한나;최윤성
    • 융합보안논문지
    • /
    • 제22권4호
    • /
    • pp.179-188
    • /
    • 2022
  • 패스워드 인증 체계 (PAS)는 개방형 네트워크에서 안전한 통신을 보장하는데 사용되는 가장 일반적인 메커니즘이다. 인수분해와 이산 로그 등의 수학적 기반의 암호 인증 체계가 제안되고 강력한 보안 기능을 제공하였으나, 암호를 구성하는데 필요한 계산 및 메시지 전송 비용이 높다는 단점을 가지고 있었다. Fairuz et al.은 스마트 카드 체계를 이용한 세션 키 동의와 관련하여 인수분해 및 이산 로그 문제를 기반으로 한 개선된 암호 인증 프로토콜을 제안했다. 하지만 본 논문에서는 취약성 분석을 통하여, Fairuz et al.의 프로토콜이 Privileged Insider Attack, Lack of Perfect Forward Secrecy, Lack of User Anonymity, DoS Attack, Off-line Password Guessing Attack에 관한 보안 취약점을 가지고 있다는 것을 확인하였다.

건설 안전용 지오펜스 감시를 위한 이동형 CCTV 연구 (A Study on Mobile CCTV for Geofence Monitoring for Construction Safety)

  • 강애띠;김상우;백은진;이지수;엄세민;함성일
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 봄 학술논문 발표대회
    • /
    • pp.381-382
    • /
    • 2023
  • Frequent accidents occur when workers at construction sites leave the safety zone, and particularly in the past 5 years, 9 fatal accidents occurred at the Korea Railroad Corporation due to train accidents on other tracks during track work. With the Severe Accident Punishment Act taking effect in January 2022, it is a priority to secure a safe work environment for workers at industrial (construction) sites. Therefore, there is a need to manage workers' departure from the safety zone (construction zone) and to facilitate communication within the construction zone. In this study, a mobile edge computing CCTV system is proposed that uses geofencing to determine whether workers are working in the danger zone, which can judge and respond in real-time to the ever-changing field environment. The proposed system is mobile and flexible, rather than server-based fixed CCTV. However, since it is designed mainly based on images, it has limitations in recognition rate depending on the environment such as distance, viewing angle, and illumination. As a way to compensate for this, it is required to develop more reliable equipment by combining technologies such as LiDAR and Radar.

  • PDF

Exploring the feasibility of fine-tuning large-scale speech recognition models for domain-specific applications: A case study on Whisper model and KsponSpeech dataset

  • Jungwon Chang;Hosung Nam
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.83-88
    • /
    • 2023
  • This study investigates the fine-tuning of large-scale Automatic Speech Recognition (ASR) models, specifically OpenAI's Whisper model, for domain-specific applications using the KsponSpeech dataset. The primary research questions address the effectiveness of targeted lexical item emphasis during fine-tuning, its impact on domain-specific performance, and whether the fine-tuned model can maintain generalization capabilities across different languages and environments. Experiments were conducted using two fine-tuning datasets: Set A, a small subset emphasizing specific lexical items, and Set B, consisting of the entire KsponSpeech dataset. Results showed that fine-tuning with targeted lexical items increased recognition accuracy and improved domain-specific performance, with generalization capabilities maintained when fine-tuned with a smaller dataset. For noisier environments, a trade-off between specificity and generalization capabilities was observed. This study highlights the potential of fine-tuning using minimal domain-specific data to achieve satisfactory results, emphasizing the importance of balancing specialization and generalization for ASR models. Future research could explore different fine-tuning strategies and novel technologies such as prompting to further enhance large-scale ASR models' domain-specific performance.

교육적 가치를 높이는 디지털배지 설계와 활용 연구 (Research on the Design and Use of Digital Badges to Increase Educational Value)

  • 민연아;이지은
    • 한국IT서비스학회지
    • /
    • 제22권6호
    • /
    • pp.71-86
    • /
    • 2023
  • The rapid change in industry and the technological gap give rise to social demand for upskilling and reskilling and spread of alternative education. Against this backdrop, digital certification and career management tools can be used to manage various types of learning activities comprehensively. Digital badges provide various kinds of history information related to individual learning, and the reliability and transparency of the issued information can be strengthened by applying blockchain technology. There have been various discussions about digital badges for a long time, but due to the lack of standards to support the issuance and distribution of digital badges, they have been partially used in some areas. However, interest in digital badges is increasing due to the development of related technologies, establishment of standards, paradigm changes in higher education, and government policies related to nurturing digital talent. This paper deals with the use of digital badges for efficient and transparent learning management and career management in an online learning environment. The researcher analyzes the technical characteristics and use cases of digital badges, and proposes a plan for use in online higher education based on them.

뉴로-심볼릭 구조 기반 온톨로지 생성기 제안 (Developing the Deep Text-to-Ontology Generator based on Neuro-Symbolic Architecture)

  • 박형철;윤은수;김민정;배희재;신유진;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.672-674
    • /
    • 2023
  • 본 논문은 뉴로-심볼릭 구조를 바탕으로 일반 텍스트로부터 온톨로지 생성이 가능한 심층 신경망 기반 온톨로지 추출기를 제안한다. 온톨로지 추출 단계를 (i) 온톨로지 학습 및 (ii) 온톨로지 생성의 2 단계로 상정, (i) 일반 텍스트로부터 문장 구조 및 논리적 관계를 학습하는 트랜스포머 기반 심층 생성 신경망 출력을 이용하여 (ii) 계층적으로 결합한 심볼릭 추론기로 온톨로지를 생성하는 뉴로-심볼릭 구조 온톨로지 추출기를 구현하였다. 1800 개 훈련 집합으로 학습 후 200 개 테스트 집합으로 평가한 결과, 정확도 91.9%, Precision 100%, Recall 99.1%로 비교 모델 OpenIE 의 성능에 비해서 각각 83.8%, 1.8%, 3.5% 개선된 것을 확인하였다. 정성적 품질에 있어서, 복잡한 문장 (예: 관계대명사, 접속사, 중첩 구조)에서도 비교 모델에 비해 더 정밀한 온톨로지 생성 결과를 보였다.

웹 구축 보조 시스템에 대한 GUI 객체 감지 및 대규모 언어 모델 활용 연구 (A Study on the Web Building Assistant System Using GUI Object Detection and Large Language Model)

  • 장현철;장형국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.830-833
    • /
    • 2024
  • As Large Language Models (LLM) like OpenAI's ChatGPT[1] continue to grow in popularity, new applications and services are expected to emerge. This paper introduces an experimental study on a smart web-builder application assistance system that combines Computer Vision with GUI object recognition and the ChatGPT (LLM). First of all, the research strategy employed computer vision technology in conjunction with Microsoft's "ChatGPT for Robotics: Design Principles and Model Abilities"[2] design strategy. Additionally, this research explores the capabilities of Large Language Model like ChatGPT in various application design tasks, specifically in assisting with web-builder tasks. The study examines the ability of ChatGPT to synthesize code through both directed prompts and free-form conversation strategies. The researchers also explored ChatGPT's ability to perform various tasks within the builder domain, including functions and closure loop inferences, basic logical and mathematical reasoning. Overall, this research proposes an efficient way to perform various application system tasks by combining natural language commands with computer vision technology and LLM (ChatGPT). This approach allows for user interaction through natural language commands while building applications.

데이터 증강을 통한 딥러닝 기반 주가 패턴 예측 정확도 향상 방안 (Increasing Accuracy of Stock Price Pattern Prediction through Data Augmentation for Deep Learning)

  • 김영준;김여정;이인선;이홍주
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.1-12
    • /
    • 2019
  • 인공지능 기술이 발전하면서 이미지, 음성, 텍스트 등 다양한 분야에 적용되고 있으며, 데이터가 충분한 경우 기존 기법들에 비해 좋은 결과를 보인다. 주식시장은 경제, 정치와 같은 많은 변수에 의해 영향을 받기 때문에, 주식 가격의 움직임 예측은 어려운 과제로 알려져 있다. 다양한 기계학습 기법과 인공지능 기법을 이용하여 주가 패턴을 연구하여 주가의 등락을 예측하려는 시도가 있어왔다. 본 연구는 딥러닝 기법 중 컨볼루셔널 뉴럴 네트워크(CNN)를 기반으로 주가 패턴 예측률 향상을 위한 데이터 증강 방안을 제안한다. CNN은 컨볼루셔널 계층을 통해 이미지에서 특징을 추출하여 뉴럴 네트워크를 이용하여 이미지를 분류한다. 따라서, 본 연구는 주식 데이터를 캔들스틱 차트 이미지로 만들어 CNN을 통해 패턴을 예측하고 분류하고자 한다. 딥러닝은 다량의 데이터가 필요하기에, 주식 차트 이미지에 다양한 데이터 증강(Data Augmentation) 방안을 적용하여 분류 정확도를 향상 시키는 방법을 제안한다. 데이터 증강 방안으로는 차트를 랜덤하게 변경하는 방안과 차트에 가우시안 노이즈를 적용하여 추가 데이터를 생성하였으며, 추가 생성된 데이터를 활용하여 학습하고 테스트 집합에 대한 분류 정확도를 비교하였다. 랜덤하게 차트를 변경하여 데이터를 증강시킨 경우의 분류 정확도는 79.92%였고, 가우시안 노이즈를 적용하여 생성된 데이터를 가지고 학습한 경우의 분류 정확도는 80.98%이었다. 주가의 다음날 상승/하락으로 분류하는 경우에는 60분 단위 캔들 차트가 82.60%의 정확도를 기록하였다.

  • PDF

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

Postpartum Reproductive Management Based on the Routine Farm Records of a Dairy Herd: Relationship between the Metabolic Parameters and Postpartum Ovarian Activity

  • Takagi, Mitsuhiro;Hirai, Toshiya;Moriyama, Naoki;Ohtani, Masayuki;Miyamoto, Akio;Wijayagunawardane, Missaka P.B.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제18권6호
    • /
    • pp.787-794
    • /
    • 2005
  • The aim of this study was 1) to confirm the practical efficiency of a routine milk P4 monitoring system for postpartum reproductive management of a dairy herd, and 2) to evaluate the relationship between the blood metabolic profiles, milk quality and body weight of individual cows in the farm records, which may reflect the postpartum nutritional condition, and the time of postpartum resumption of ovarian activity of dairy cows. A total of 116 Holstein cows was used in the present study. First, during the period of Experiment 1, postpartum reproductive management based on weekly measured milk P4 concentration from individual cows was conducted. Compared with the reproductive records of the past two years without P4 monitoring, although the day from calving to first AI did not change, both the number of AI until pregnant (with P4; 1.9 times vs. without P4; 2.9 times) and the days open (with P4; 95.1 days vs. without P4; 135.8 days and 133.8 days) were significantly decreased. In Experiment 2, the measurement of blood constituents such as albumin, blood urea nitrogen, packed cell volume, ammonia, glucose, total cholesterol, non-esterified, AST and $\gamma$-GTP was performed on the blood samples taken once approximately 14 days postpartum, to monitor both health and nutritional conditions. The milk constituent parameters, such as milk protein (MP), milk fat (MF), SNF and lactose, collected from the monthly progeny test of individual cows, were used to monitor the postpartum nutritional status. Furthermore, the data obtained from the routine measurements of body weight were used to calculate the rate of peripartum body weight loss. The resumption day of the postpartum estrous cycle was assumed from the milk P4 profiles of individual cows. There was no clear relationship between each parameter from blood examination and those from resumption time. However, the cows had low values of MP, and SNF, which significantly affected the resumption of the postpartum estrous cycle. Similarly, a higher rate of body weight loss indicated a significant delay (more than 1 month) in the resumption of the postpartum estrous cycle, compared with the groups that had a medium or lower rate of body weight loss. The results of the present study demonstrated that the implementation of routine milk P4 monitoring-based postpartum reproductive management, together with milk quality parameters and routine BW data available in field conditions may be utilized as a practical approach for increasing the postpartum reproductive efficiency of a high yielding dairy herd.