• 제목/요약/키워드: Language Model(LM)

검색결과 13건 처리시간 0.017초

관련 연구 자동 생성을 위한 LLM의 활용 및 정제 기법 제안 (Proposal for the Utilization and Refinement Techniques of LLMs for Automated Research Generation)

  • 최승민;정유철
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.275-287
    • /
    • 2024
  • 과거부터 꾸준히 지식 그래프(Knowledge Graph)와 언어 모델(LM, Language Model)의 통합에 대한 많은 연구가 다뤄지고 있다. 그 중, 지식 그래프의 구조화된 지식을 이용해 자동 텍스트 생성을 다루는 연구는 그리 활성화되지 않았다. 본 연구에서는 기존 논문들과 비슷한 수준의 특정 도메인 관련 연구 항목(Related Work)을 자동 생성하기 위한 방법론, 즉, '1) 최적의 Prompt 선정, 2) 4단계 정제기법을 통해 Triple 추출, 3) 지식 그래프 구축, 4) 관련 연구 자동 생성'을 제안한다. 제안된 방법론은 대규모 언어 모델(LLM) 중, GPT-4를 활용하고, 4단계 정제 기법을 적용하여 관련 연구를 자동으로 생성하도록 설계했다. 그렇게 설계된 모델은 Triple 추출에서 #Supp, #Cont, Fluency에서 17.3, 14.1, 4.2의 성능과 GPT-4 자동 평가 기준, 100점 기준 정제 전, 88.5점에서 정제 후, 96.5점으로 기존 논문과 비슷한 수준의 유의미한 관련 연구 자동 생성 능력을 보였다.

빅카인즈를 활용한 GenAI(생성형 인공지능) 기술 동향 분석: ChatGPT 등장과 스타트업 영향 평가 (GenAI(Generative Artificial Intelligence) Technology Trend Analysis Using Bigkinds: ChatGPT Emergence and Startup Impact Assessment)

  • 이현주;성창수;전병훈
    • 벤처창업연구
    • /
    • 제18권4호
    • /
    • pp.65-76
    • /
    • 2023
  • 기술 창업 및 스타트업 분야에서는 인공지능(AI)의 발전이 사업 모델 혁신의 핵심 주제로 부상하였다. 이를 통해 벤처기업들은 경쟁력 확보를 위해 AI를 중심으로 다양한 노력을 기울이고 있다. 본 연구는 GenAI 기술의 발전과 스타트업 생태계 간의 관계를 국내 뉴스 기사를 분석하여, 기술 창업 분야의 동향을 파악하는 것을 목적으로 하였다. 본 연구는 빅카인즈(BIG Kinds)를 활용하여 1990년부터 2023년 8월 10일까지의 국내 뉴스 기사에서 ChatGPT의 등장 전후를 중심으로 GenAI 관련 뉴스 기사, 주요 이슈 및 트렌드의 변화를 조사하였으며, 네트워크 분석 및 키워드 시각화를 통해 관련성을 시각화하였다. 연구결과, 2017년부터 2023년까지 GenAI에 대한 언급이 기사 내에서 점차 증가하였다. 특히, OpenAI의 GPT-3.5를 기반으로 한 ChatGPT 서비스가 주요 이슈로 부각 되었는데, 이 서비스는 OpenAI의 DALL-E, Google의 MusicLM, VoyagerX의 Vrew 등과 같은 언어 모델 기반 GenAI 기술의 대중화를 시사하였다. 이로써 생성형 인공지능은 다양한 분야에서의 유용성을 입증하며, ChatGPT 출시 이후 국내 기업들의 한국어 언어 모델 개발 활동이 활발히 이루어지고 있는 것으로 확인되었다. 리튼 테크놀로지스와 같은 스타트업들도 GenAI를 활용하여 기술 창업 분야에서의 영역을 확장하고 있다. 본 연구에서는 GenAI 기술과 스타트업 창업 활동 간의 연관성을 확인하였으며, 이는 혁신적인 비즈니스 전략의 구축 지원을 시사하며 GenAI 기술의 발전과 스타트업 생태계의 성장을 지속해서 형성할 것으로 전망된다. 더 나아가 국제적 동향 및 다양한 분석 방법의 활용, 실제 현장에서의 GenAI 응용 가능성을 모색하는 연구가 요구 된다. 이러한 노력은 GenAI 기술의 발전과 스타트업 생태계의 성장 발전에 이바지할 것으로 기대된다.

  • PDF

잠정적 부적합 문서와 어휘 근접도를 반영한 어휘 그래프 기반 질의 확장 (Query Expansion Based on Word Graphs Using Pseudo Non-Relevant Documents and Term Proximity)

  • 조승현;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.189-194
    • /
    • 2012
  • 본 논문에서는 정보검색 성능 향상을 위해 잠정적 적합 문서 및 부적합 문서와 어휘 그래프를 이용한 질의 확장 방법을 제안한다. 언어모델에 의한 초기 검색 결과 상위 문서들은 질의 어휘 조합과 근접도를 기반으로 핵심 질의를 포함하는 문서들로 구성된 핵심 질의 클러스터와 핵심 질의를 포함하지 않는 문서들로 구성된 비핵심 질의 클러스터로 분류된다. 이때, 핵심 질의 클러스터는 잠정적 적합 문서 집합으로, 비핵심 질의 클러스터는 잠정적 부적합 문서 집합으로 본다. 각 클러스터는 어휘들과 질의 어휘와의 가까운 정도에 따라 어휘 그래프로 표현된다. 각 어휘에 대한 중요도는 핵심 질의 클러스터 그래프에서의 어휘 가중치에서 비핵심 질의 클러스터 그래프에서의 어휘의 가중치를 빼서 계산한다. 이는 부적합 문서에서 높은 가중치를 갖는 어휘는 확장 질의에서 제외시키는 역할을 한다. 중요도가 높은 어휘 순으로 확장할 질의를 선택한다. 웹 문서 테스트컬렉션인 TREC WT10g에서의 실험 결과에서 제안 방법이 언어모델(LM)에 비해 평균 정확률의 평균(MAP)에서 9.4% 성능 향상을 보였다.