• 제목/요약/키워드: 거대 언어모델

검색결과 62건 처리시간 0.019초

효율적인 Transformer 모델 경량화를 위한 구조화된 프루닝 (Structured Pruning for Efficient Transformer Model compression)

  • 류은지;이영주
    • 반도체공학회 논문지
    • /
    • 제1권1호
    • /
    • pp.23-30
    • /
    • 2023
  • 최근 거대 IT 기업들의 Generative AI 기술 개발로 Transformer 모델의 규모가 조 단위를 넘어가며 기하급수적으로 증가하고 있다. 이러한 AI 서비스를 지속적으로 가능케 하기 위해선 모델 경량화가 필수적이다. 본 논문에서는 하드웨어 친화적으로 구조화된(structured) 프루닝 패턴을 찾아 Transformer 모델의 경량화 방법을 제안한다. 이는 모델 알고리즘의 특성을 살려 압축을 진행하기 때문에 모델의 크기는 줄어들면서 성능은 최대한 유지할 수 있다. 실험에 따르면 GPT2 와 BERT 언어 모델을 프루닝할 때 제안하는 구조화된 프루닝 기법은 희소성이 높은 영역에서도 미세 조정된(fine-grained) 프루닝과 거의 흡사한 성능을 보여준다. 이 접근 방식은 미세 조정된 프루닝 대비 0.003%의 정확도 손실로 모델매개 변수를 80% 줄이고 구조화된 형태로 하드웨어 가속화를 진행할 수 있다.

공공디자인 정책 결정에 ChatGPT의 활용 가능성에 관한연구 (A Study on the Potential Use of ChatGPT in Public Design Policy Decision-Making)

  • 손동주;윤명한
    • 서비스연구
    • /
    • 제13권3호
    • /
    • pp.172-189
    • /
    • 2023
  • 본 연구는 공공디자인 정책 결정에 있어 거대 언어 및 정보 모델인 ChatGPT가 기여할 가능성이 있는지에 대해 공공디자인 가진 특징을 중심으로 연구했다. 공공디자인은 디자인의 원리와 접근법을 사용하여 사회문제를 해결하고, 공공서비스 개선을 목표로 한다. 공공디자인 정책과 계획을 수립하기 위해서는 지역의 일반 현황, 인구 현황, 인프라 현황, 자원 현황, 안전 현황, 정책 현황, 법규 현황, 경관 현황, 공간 현황, 공공디자인 현황, 지역 이슈 등 방대한 자료를 기반으로 한다. 따라서 공공디자인은 방대한 자료와 더불어 방대한 언어를 수록하는 디자인 연구 분야다. 인공지능 기술의 급속한 발전과 공공디자인의 중요성을 고려해 ChatGPT와 같은 거대 언어 및 정보 모델이 공공디자인 정책에 어떻게 기여할 수 있는지 알아보고자 한다. 이와 함께, 공공디자인의 개념 및 원칙, 그리고 정책 개발과 실행에 대한 역할을 검토하고, ChatGPT의 개요 및 특징, 적용 사례나 ChatGPT의 선행 연구를 살펴 공공디자인 정책 결정에 활용할 수 있는지 연구했다. 연구 결과, ChatGPT는 공공디자인 정책 수립과정에서 방대한 언어 정보를 제공하고, 의사결정의 지원 역할이 가능하다는 사실을 밝혔다. 특히, ChatGPT는 정책 수립과정에서 다양한 관점을 제공하고, 정책 결정에 필요한 정보를 신속하게 제공하는 데 유용함이 있었다. 이와 함께 정부 정책 개발에 인공지능을 활용하는 추세라는 것이 여러 논문을 통해 확인되었다. 하지만, ChatGPT의 활용에는 윤리적, 법적, 개인 프라이버시 등의 문제 또한 발견되었다. 무엇보다 윤리적인 문제가 제기되었으며, 편향성과 공정성 관련 문제 또한 나타났다. ChatGPT를 공공디자인의 정책 결정에 실질적으로 활용하려면, 첫째, 정책 개발자와 공공디자인 전문가의 역량을 일정부분 키워 활용해야 한다. 둘째, 가칭 '인공지능 정책 활용에 관한 조례'라는 법령(法令)을 마련해 법률(法律)적 정비가 이뤄지기 전까지 지속해서 보완해가면서 활용하는 것이다. 현재로서는 이 두 가지 방안을 적용해 활용하는 것이 필요하다. 따라서 공공디자인 정책 결정에 있어 ChatGPT와 같은 거대 언어 및 정보 모델의 활용은 방대한 언어를 수록하는 디자인 분야에서는 활용할 가치가 충분하다는 것이다.

객체지향 기법을 적용한 삼상조류계산 (Three Phase Loadflow Applied for Object-Oriented Programming)

  • 이영민;김건중;김원경;장정태
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1997년도 하계학술대회 논문집 D
    • /
    • pp.1091-1093
    • /
    • 1997
  • 조류계산은 전력계통해석에서 가장 기본적인 것이다. 일반적으로 조류계산은 선로의 3상을 평형으로 간주하여 한상에 대해서만 해석하였다. 삼상조류계산의 복잡함에 비해 그 필요성은 크지 않았기 때문이었다. 한편, 80년대에 소프트웨어 위기의 대안으로 제시되었던 객체지향기법(OOP)은 객체의 효율적인 모델링을 통해 복잡하고 거대한 프로그램의 작성을 보다 용이하게 할 수 있도록 하였다. 본 논문에서는 전력계통의 콤포넌트와 그 콤포넌트로 구성된 전력계통을 모델링하였고 계산에서 사용하는 수학적 모델을 모델링하였다. 또한 본 논문에서 사용한 객체지향 언어인 C++의 큰 특징인 template을 적응하였다. 결과적으로 기존의 단상 조류계산과 삼상조류계산이 사용되는 콤포넌트의 모델이 다른 것을 제외하고는 전체적인 구조를 동일하게 할 수 있었다.

  • PDF

웹 기반 시뮬레이터의 구현 (Development of a Web-Based Simulator)

  • 김종은
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 추계학술대회 논문집
    • /
    • pp.331-336
    • /
    • 1999
  • 웹은 지난 수년간 급속도로 발전하였으며 웹의 다양한 활용 분야 중에서 시뮬레이션은 웹의 특성을 가장 잘 이용하는 분야 중 하나로, 웹 기반 시뮬레이션의 구현에 대한 연구가 활발히 이루어지고 있다. 또한 Java 언어의 출현은 웹에서 실질적인 애니메이션과 애니메이션들간의 상호동작을 가능하게 한다. 웹 기반 분산 시뮬레이션은 웹의 분산 특성과 자바의 객체지향 특성을 이용한 분산 시뮬레이션이다. time-warp 기법을 사용하는 웹 기반 분산 시뮬레이션에서 speedup에 대한 성능은 rollback과 통신 지연이 가장 중요한 요인이다. rollback이 발생한 경우 시뮬레이션을 다시 수행하여 시뮬레이션을 매우 느리게 한다. 이러한 rollback과 통신 지연의 방대한 오버헤드는 시뮬레이션 모델의 지역적 분할을 사용할 때 발생한다. 본 발표에서는 time-warp을 기본 구졸 자바의 RMI를 사용하는 웹 기반 분산 시뮬레이션에서 통신 지연에 의한 오버헤드 및 거대한 병렬성과 분산을 고려한 시뮬레이션의 구현 모델을 제안하고 구현한다.

  • PDF

생성-선정을 통한 텍스트 증강 프레임워크 (TAGS: Text Augmentation with Generation and Selection)

  • 김경민;김동환;조성웅;오흥선;황명하
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.455-460
    • /
    • 2023
  • 텍스트 증강은 자연어처리 모델의 성능 향상을 목적으로 원본 텍스트의 변환, 생성을 통하여 새로운 증강 텍스트를 생성하는 방법론이다. 기존 연구된 기법들은 표현적 다양성 부족, 의미 왜곡 , 한정적인 양의 증강 텍스트와 같은 한계점이 존재한다. 거대언어모델과 few-shot learning을 활용한 텍스트 증강은 이러한 한계점의 극복이 가능하지만, 잘못된 생성으로 인한 노이즈 발생의 위험성이 존재한다. 본 논문에서는 여러 후보 텍스트를 생성하고 적합한 텍스트를 증강 텍스트로 선정하는 TAGS를 제안한다. TAGS는 기존 텍스트 few shot learning을 통해 다양한 표현을 생성하면서 대조 학습과 유사도 비교를 통해 원본 텍스트가 적더라도 적합한 데이터를 효과적으로 선정한다. 이를 텍스트 증강이 필수적인 업무용 챗봇 데이터에 적용하여 60배 이상의 양적 향상을 달성하였다. 또한 증강 텍스트의 질적 향상을 확인하기 위해 실제 생성된 텍스트를 분석하여 원본 텍스트에 비해 의미론적, 표현적으로 다양한 텍스트를 생성함을 확인하였으며, 증강 텍스트로 실제 분류 모델을 학습하고 실험하여 실질적으로 자연어처리 모델 성능 향상에 도움이 되는 것을 확인하였다.

문서 데이터 정보화를 위한 지능형 문서처리 플랫폼에 관한 연구 (A Study on the Intelligent Document Processing Platform for Document Data Informatization)

  • 허희도;강동구;김영수; 전삼현
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.89-95
    • /
    • 2024
  • 요즘 기업의 경쟁력은 조직이 축적한 조직의 지식들을 모든 조직원들이 잘 공유하고 활용하는 능력에 달려있다. 이것을 증명이라도 하듯이 지금 세상은 LLM(거대언어모델)의 기반의 생성형 AI 기술을 이용한 쳇GPT서비스에 대해 집중하고 있다. 하지만, 쳇GPT 서비스를 업무에 적용하기에는 아직 환각성 문제가 많아 어려운 상태이다. 이 문제를 해결하기 위해 sLLM(경량거대언어모델) 기술이 대안으로 제시되고 있다. sLLM을 구성하기 위해서는 기업데이터가 필수적으로 필요하다. 기업데이터는 조직의 ERP Data와 조직이 보존하고 있는 기업의 오피스 문서 지식 데이터이다. ERP Data는 sLLM과 직접 연결하여 활용할 수 있으나 오피스 문서는 파일 형태로 저장되어 있어서 데이터 형태로 변환하여야 sLLM과 연결하여 활용할 수 있다. 뿐만 아니라 파일 형태로 저장되어져 있는 오피스 문서들을 조직을 지식 정보로 활용하기에는 기술적 제약 사항이 너무 많다. 본 연구는 오피스 문서를 파일 형태가 아닌 DB 형태로 저장하는 방법을 제시함으로서 기업이 기 축적 된 오피스 문서를 조직의 지식 시스템으로 잘 활용할 수 있게 하고, 기업의 sLLM에 오피스 문서를 데이터 형태로 제공하여 AI 기술과 접목하여 기업 경쟁력을 향상 시키는데 기여하고자 한다.

서비스 공급사슬을 위한 객체지향 시뮬레이션 모델링 (Object-oriented Simulation Modeling for Service Supply Chain)

  • 문종혁;이영해;조동원
    • 한국시뮬레이션학회논문지
    • /
    • 제21권1호
    • /
    • pp.55-68
    • /
    • 2012
  • 최근 경제는 제조업에서 서비스업으로 이동하고 있기 때문에 서비스 공급사슬을 이해하는 것이 중요하다. 그러나, 공급사슬과 관련된 기존연구의 대부분은 제조업에 집중하고 있다. 이러한 상황을 극복하기 위해서, 서비스 공급사슬을 조사하고 분석할 필요가 있다. 시뮬레이션은 복잡한 시스템을 분석하고 설계하는데 가장 자주 사용되는 기법 중에 하나이다. 서비스 공급사슬은정교한 설계 단계가 필요한 복잡하고 거대한 시스템이다. 특히, 서비스 공급사슬의 성과를 예측하기 위해서 서비스 공급사슬을 구성하고 있는 구성요소 사이의 동적인 상호작용의 행위를 밀접하게 조사하는 것이 중요하다. 본 연구에서는 첫 번째로 서비스공급사슬의 개념적 모델이 개발된다. 다음으로 개발된 서비스 공급사슬의 개념적 모델에 대한 시뮬레이션 모델을 개발하기위한 새로운 절차를 제시한다. 시뮬레이션 모델링의 절차는 UML 분석과 설계 도구를 이용하며 ARENA 시뮬레이션 언어로 구현된다. 제안된 절차의 두 가지 주요한 특성은 서비스 공급사슬을 설계하는데 체계적인 절차의 정의와 또한 ARENA 시뮬레이션 언어로 개념적 모델의 변환에 대한 규칙을 제공한다. 본 연구의 결과는 서비스 공급사슬의 지식을 개선하는데 이용될 수 있으며, 또한 서비스 공급사슬 시뮬레이션 모델의 개발을 효율적으로 할 수 있도록 지원한다.

SQL BNF 문법 기반의 자동 질의 생성기를 이용한 DBMS 테스트 (Automated Query based on SQL BNF Grammar for Testing DBMS)

  • 김정겸;황민호;권숙연;임종혁;배유진;하만재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.138-143
    • /
    • 2010
  • 현대의 데이터베이스 서버는 거대하고 복잡한 소프트 시스템의 구조이다. 복잡한 SQL(Structured query language) 언어는 점점 늘어가고 ANSI 표준을 바탕으로 새로운 형태로 발달하고 있다. 데이터베이스 서버를 테스트하는 작업은 꾸준히 진행되어 왔으며 앞으로도 계속 도전하고 있는 과제중 하나이다. 그 과제에 적합한 새로운 테스트 기법의 개발을 위해서는 보편적으로 막대한 인력과 비용이 요구된다. 본 논문에서는 수동적인 테스트에서의 막대한 인력과 비용의 문제로부터의 해결책을 제공하기 위해서 자동화된 SQL 쿼리 테스트 프레임워크를 제시한다. 본 프레임워크는 SQL의 기본이 되는 SQL BNF(Backus-Naur Format) 문법을 기본으로 하여 문법적, 의미적으로 정확한 "지능적인" SQL 쿼리를 랜덤하게 자동적으로 생성 한다. 생성된 "지능적인" 쿼리는 논리적 모델에서 얻어지고, 통계적인 정보를 통해 사용자에게 유용한 체크리스트를 제공한다. 각각의 데이터베이스 개발업체는 그들의 데이터베이스와 새롭게 개발되는 데이터베이스를 통합적으로 테스트 환경을 제공함에 따라 테스트 과정에서의 인력과 비용의 문제를 해결하고, 데이터베이스의 장단점을 파악하는 기준을 제공하여 품질 향상에 도움이 될 것이다.

  • PDF

A Design and Implementation of The Deep Learning-Based Senior Care Service Application Using AI Speaker

  • Mun Seop Yun;Sang Hyuk Yoon;Ki Won Lee;Se Hoon Kim;Min Woo Lee;Ho-Young Kwak;Won Joo Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.23-30
    • /
    • 2024
  • 본 논문에서는 딥러닝 기반의 개인 맞춤형 실버세대 케어 서비스 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 사용자의 편의성을 고려하여 STT(Speech to Text) 기술을 사용해 사용자의 발화를 텍스트로 변환하고, 이를 Microsoft 사의 대화형 멀티 에이전트 거대 언어 모델인 Autogen의 입력으로 사용한다. Autogen은 사용자와 ChatBot의 대화 데이터를 활용하여 상대방의 의도를 파악하여 답변에 대하여 응답한다. 그리고 백엔드 에이전트를 활용하여 위시리스트, 공유 달력 그리고 보이스 클로닝을 위한 딥러닝 모델을 통해 상대방의 목소리가 담긴 안부 메시지 기능을 제공한다. 또한, 애플리케이션은 SKT 사의 인공지능 누구(NUGU) 스피커를 탑재하여 홈 IoT 서비스 기능을 제공한다. 이러한 기능을 통해 제안하는 지능형 애플리케이션은 향후 미래 인공지능 기반의 실버세대 케어 기술에 기여할 것이다.

거대언어모델을 활용한 변증 교육도구 개발 가능성 탐색: 피로주증의 심비양허형 모의환자에 대한 사례구축을 중심으로 (Exploring the feasibility of developing an education tool for pattern identification using a large language model: focusing on the case of a simulated patient with fatigue symptom and dual deficiency of the heart-spleen pattern)

  • 이원융;한상윤;이승호
    • 대한한의학방제학회지
    • /
    • 제32권1호
    • /
    • pp.1-9
    • /
    • 2024
  • Objective : This study aims to assess the potential of utilizing large language models in pattern identification education by developing a simulated patient with fatigue and dual deficiency of the heart-spleen pattern. Methods : A simulated patient dataset was constructed using the clinical practice examination module provided by the National Institute for Korean Medicine Development. The dataset was divided into patient characteristics, sample questions, and responses, and utilized to design the system, assistant, and user prompts, respectively. A web-based interface was developed using the Django framework and WebSocket. Results : We developed a simulated fatigue patient representing dual deficiency of the heart-spleen pattern through prompt engineering. To make practical tools, we further implemented web-based interfaces for the examinee's and evaluator's roles. The interface for examinees allows one to examine the simulated patient and provides access to a personalized number for future access. In addition, the interface for evaluators included a page that provided an overview of each examinees' chat history and evaluation criteria in real-time. Conclusion : This study is the first development of an educational tool integrated with a large language model for pattern identification education, which is expected to be widely applied to Korean medicine education.