• 제목/요약/키워드: software classification

검색결과 911건 처리시간 0.026초

사회문제 해결 연구보고서 기반 문장 의미 식별 데이터셋 구축 (Building Sentence Meaning Identification Dataset Based on Social Problem-Solving R&D Reports)

  • 신현호;정선기;전홍우;권이남;이재민;박강희;최성필
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권4호
    • /
    • pp.159-172
    • /
    • 2023
  • 일반적으로 사회문제 해결 연구는 과학기술을 활용하여 다양한 사회적 현안들에 의미있는 해결 방안을 제시함으로써 중요한 사회적 가치를 창출하는 것을 연구 목표로 한다. 그러나 사회문제와 쟁점을 완화하기 위하여 많은 연구들이 국가적으로 수행되었음에도 불구하고 여전히 많은 사회문제가 남아 있는 상황이다. 사회문제 해결 연구의 전 과정을 원활하게 하고 그 효과를 극대화하기 위해서는 사회적으로 시급한 현안들에 대한 문제를 명확하게 파악하는 것이 중요하다. 사회문제 해결과 관련된 기존 R&D 보고서와 같은 자료에서 중요한 사안을 자동으로 식별할 수 있다면 사회문제 파악 단계가 크게 개선될 수 있다. 따라서 본 논문은 다양한 국가 연구보고서에서 사회문제와 해결방안을 자동으로 감지하기 위한 기계학습 모델을 구축하는 데에 필수적인 데이터셋을 제안하고자 한다. 우선 데이터를 구축하기 위해 사회문제와 쟁점을 다룬 연구보고서를 총 700건 수집하였다. 수집된 연구보고서에서 사회문제, 목적, 해결 방안 등 사회문제 해결과 관련된 내용이 담긴 문장을 추출 후 라벨링을 수행하였다. 또한 4개의 사전학습 언어모델을 기반으로 분류 모델을 구현하고 구축된 데이터셋을 통해 일련의 성능 실험을 수행하였다. 실험 결과 KLUE-BERT 사전학습 언어모델을 미세조정한 모델이 정확도 75.853%, F1 스코어 63.503%로 가장 높은 성능을 보였다.

데이터 기반 리튬 이온 배터리 성능 예측을 위한 학습 데이터 모델 정의 및 기계학습 분석 (Learning Data Model Definition and Machine Learning Analysis for Data-Based Li-Ion Battery Performance Prediction)

  • 김병욱;박지수;장홍준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.133-140
    • /
    • 2023
  • 리튬 이온 배터리는 사용 환경과 양극재 조합 비율에 따라 배터리의 성능이 좌우된다. 고성능 리튬 이온 배터리를 개발하기 위해서는 양극재 비율을 다양하게 변화시켜가면서 배터리를 제작하고 성능을 측정해야 한다. 하지만 모든 변수 조합에 대해 배터리를 제작하고 성능을 측정하기에는 많은 시간과 비용이 소모된다. 그렇기 때문에 최근에는 데이터 기반으로 인공지능 모델을 활용하여 배터리의 성능을 예측하고자 하는 연구가 활발히 진행되고 있다. 그러나 기존 공개 배터리 데이터는 동일한 배터리로 측정 실험을 하였기 때문에 양극재 조합 비율은 고정되어 있어서 데이터 속성으로 포함되지 않았다. 본 논문에서는 양극재 소재 조합 비율에 따른 배터리의 성능을 예측할 수 있는 인공지능 모델 개발에 필요한 학습 데이터 모델을 정의한다. 우리는 리튬 이온 배터리의 성능에 영향을 미칠 수 있는 요인을 분석하여 양극재 소재별 질량과 배터리 사용 환경을 입력데이터로, 배터리의 출력과 용량을 목적 데이터로 정의하였다. 공개 배터리 데이터 중에는 양극재 비율이 포함된 데이터가 없어 양극재 비율을 모두 동일한 값으로 설정한 제한된 데이터로 다중 선형회귀 분석, 서포트 벡터 회귀분석, 다중 로지스틱 회귀 분석, LSTM 분석을 수행하였다. 실험 환경이 다른 배터리 데이터에서 각각의 배터리 데이터는 고유한 패턴을 유지하였으며, 배터리 분류 모델은 각각의 배터리를 약 2%의 오차로 분류하는 것으로 나타났다.

생성-선정을 통한 텍스트 증강 프레임워크 (TAGS: Text Augmentation with Generation and Selection)

  • 김경민;김동환;조성웅;오흥선;황명하
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.455-460
    • /
    • 2023
  • 텍스트 증강은 자연어처리 모델의 성능 향상을 목적으로 원본 텍스트의 변환, 생성을 통하여 새로운 증강 텍스트를 생성하는 방법론이다. 기존 연구된 기법들은 표현적 다양성 부족, 의미 왜곡 , 한정적인 양의 증강 텍스트와 같은 한계점이 존재한다. 거대언어모델과 few-shot learning을 활용한 텍스트 증강은 이러한 한계점의 극복이 가능하지만, 잘못된 생성으로 인한 노이즈 발생의 위험성이 존재한다. 본 논문에서는 여러 후보 텍스트를 생성하고 적합한 텍스트를 증강 텍스트로 선정하는 TAGS를 제안한다. TAGS는 기존 텍스트 few shot learning을 통해 다양한 표현을 생성하면서 대조 학습과 유사도 비교를 통해 원본 텍스트가 적더라도 적합한 데이터를 효과적으로 선정한다. 이를 텍스트 증강이 필수적인 업무용 챗봇 데이터에 적용하여 60배 이상의 양적 향상을 달성하였다. 또한 증강 텍스트의 질적 향상을 확인하기 위해 실제 생성된 텍스트를 분석하여 원본 텍스트에 비해 의미론적, 표현적으로 다양한 텍스트를 생성함을 확인하였으며, 증강 텍스트로 실제 분류 모델을 학습하고 실험하여 실질적으로 자연어처리 모델 성능 향상에 도움이 되는 것을 확인하였다.

중소기업의 ESG평가에 대한 전략적 대응방안 탐색적 연구 (An Exploratory Study on the Strategic Responses to ESG Evaluation of SMEs)

  • 박윤수
    • 벤처창업연구
    • /
    • 제18권1호
    • /
    • pp.47-65
    • /
    • 2023
  • 이해관계자 요구와 지속가능금융 성장에 따라 ESG경영과 이를 반영한 ESG평가 대응이 중요해지고 있다. 중소기업 또한 공급망 관리와 금융거래에 영향을 주는 ESG평가 규범화 흐름에 대비해야 한다. 그러나 중소기업은 생존에 우선 집중할 수밖에 없어 ESG경영 도입에 제약이 따른다. 또한 중소기업의 ESG경영 당위성에 대한 연구가 부족하고 ESG 평가체계 및 평가등급의 변동성 또한 높아지고 있다. 이에 따라 선행연구 고찰과 함께 ESG 평가동향 및 실무지침서의 비판적 검토가 필요하다. 탐색적 연구 결과, 중소기업은 실행전략 차원에서 생존기반이 담보되는 여건 하에 ESG경영을 도입하고 ESG창업에 특화하는 노력이 필요하다. 또한 조직적 학습과 소프트웨어 관리로 ESG평가에 유리한 정보 축적과 함께 다양한 평가결과의 전략적 활용에 중점을 둘 필요가 있다. 본 연구의 시사점은 중소기업의 ESG평가에 있어 중소기업에 대한 분류기준과 ESG 평가등급과 장기 생존률과의 관계 연구 등 다양한 연구가 필요하다는 점이다. 정부정책 차원에서도 생존 가능성과 함께 업종과 규모별로 상이한 수준의 ESG경영 도입 및 ESG평가가 이루어지도록 중소기업 전용 ESG 평가제도의 검토가 필요한 시점이다.

  • PDF

Fully Automatic Coronary Calcium Score Software Empowered by Artificial Intelligence Technology: Validation Study Using Three CT Cohorts

  • June-Goo Lee;HeeSoo Kim;Heejun Kang;Hyun Jung Koo;Joon-Won Kang;Young-Hak Kim;Dong Hyun Yang
    • Korean Journal of Radiology
    • /
    • 제22권11호
    • /
    • pp.1764-1776
    • /
    • 2021
  • Objective: This study aimed to validate a deep learning-based fully automatic calcium scoring (coronary artery calcium [CAC]_auto) system using previously published cardiac computed tomography (CT) cohort data with the manually segmented coronary calcium scoring (CAC_hand) system as the reference standard. Materials and Methods: We developed the CAC_auto system using 100 co-registered, non-enhanced and contrast-enhanced CT scans. For the validation of the CAC_auto system, three previously published CT cohorts (n = 2985) were chosen to represent different clinical scenarios (i.e., 2647 asymptomatic, 220 symptomatic, 118 valve disease) and four CT models. The performance of the CAC_auto system in detecting coronary calcium was determined. The reliability of the system in measuring the Agatston score as compared with CAC_hand was also evaluated per vessel and per patient using intraclass correlation coefficients (ICCs) and Bland-Altman analysis. The agreement between CAC_auto and CAC_hand based on the cardiovascular risk stratification categories (Agatston score: 0, 1-10, 11-100, 101-400, > 400) was evaluated. Results: In 2985 patients, 6218 coronary calcium lesions were identified using CAC_hand. The per-lesion sensitivity and false-positive rate of the CAC_auto system in detecting coronary calcium were 93.3% (5800 of 6218) and 0.11 false-positive lesions per patient, respectively. The CAC_auto system, in measuring the Agatston score, yielded ICCs of 0.99 for all the vessels (left main 0.91, left anterior descending 0.99, left circumflex 0.96, right coronary 0.99). The limits of agreement between CAC_auto and CAC_hand were 1.6 ± 52.2. The linearly weighted kappa value for the Agatston score categorization was 0.94. The main causes of false-positive results were image noise (29.1%, 97/333 lesions), aortic wall calcification (25.5%, 85/333 lesions), and pericardial calcification (24.3%, 81/333 lesions). Conclusion: The atlas-based CAC_auto empowered by deep learning provided accurate calcium score measurement as compared with manual method and risk category classification, which could potentially streamline CAC imaging workflows.

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.

준지도학습 방법을 이용한 흉부 X선 사진에서 척추측만증의 진단 (Diagnosis of Scoliosis Using Chest Radiographs with a Semi-Supervised Generative Adversarial Network)

  • 이우진;신기원;이준수;유승진;윤민아;최요원;홍길선;김남국;백상현
    • 대한영상의학회지
    • /
    • 제83권6호
    • /
    • pp.1298-1311
    • /
    • 2022
  • 목적 흉부 X선 사진에서 척추측만증을 조기진단 할 수 있는 딥러닝 기반의 스크리닝 소프트웨어를 준지도학습(semi-supervised generative adversarial network; 이하 GAN) 방법을 이용하여 개발하고자 하였다. 대상과 방법 두 곳의 상급종합병원에서 촬영된 흉부 X선 사진에서 척추측만증을 조기진단할 수 있는 스크리닝 소프트웨어를 개발하기 위하여 GAN 방법이 이용되었다. GAN의 훈련과정에서 경증에서 중증의 척추측만증을 보이는 흉부 X선 사진들을 사용하였으며 upstream task에서 척추측만증의 특징을 학습하고, downstream task에서 정상과 척추측만증을 분류하도록 훈련하였다. 결과 수신자 조작 특성 곡선의 곡선하면적(area under the receiver operating characteristic curve), 음성예측도, 양성예측도, 민감도 및 특이도는 각각 0.856, 0.950, 0.579, 0.985, 0.285이었다. 결론 우리가 GAN 방법을 이용하여 개발한 딥러닝 기반의 스크리닝 소프트웨어는 청소년의 흉부 X선에서 척추측만증을 진단하는데 있어서 높은 음성예측도와 민감도를 보였다. 이 소프트웨어가 건강검진을 목적으로 촬영한 청소년의 흉부 X선 사진에 진단 스크리닝 도구로써 이용된다면 영상의학과 의사의 부담을 덜어주며, 척추측만증의 조기진단에 기여할 것으로 생각된다.

중고령 노인의 개인적 가치에 따른 라이프스타일 분류: 머신러닝을 활용한 상대적 중요도 분석 (Identifying Personal Values Influencing the Lifestyle of Older Adults: Insights From Relative Importance Analysis Using Machine Learning)

  • 임승주;박지혁
    • 재활치료과학
    • /
    • 제13권2호
    • /
    • pp.69-84
    • /
    • 2024
  • 목적 : 노인의 건강한 삶의 방식으로서 라이프스타일에 대한 연구가 증가하고 있다. 라이프스타일이 개개인의 가치와 삶의 태도를 반영하는 개념임에도 불구하고, 아직까지 개인의 어떠한 가치가 라이프스타일을 건강하게 유도하는지 파악한 연구는 부족한 실정이다. 이에 본 연구는 노인의 라이프스타일 유형을 두 가지로 분류하고, 머신러닝을 활용하여 어떠한 개인적 가치가 건강한 라이프스타일에 우선적으로 작용하는지 파악하고자 한다. 연구방법 : 본 연구는 지역사회에 거주하는 55세 이상 중고령 노인 300명을 대상으로 횡단 연구를 수행하였다. 라이프스타일은 Yonsei Lifestyle Profile-Active, Balanced, Connected, Diverse (YLP-ABCD) 응답을 사용하여 잠재프로파일 분석을 통해 유형화하였다. 라이프스타일 유형을 예측하는 개인적 가치는 YLP-V (Values) 응답을 수집하여, 예측성능이 가장 높은 머신러닝 알고리즘을 선정한 후 상대적 중요도를 파악하였다. 결과 : 잠재프로파일 분석 결과, 라이프스타일은 건강한 라이프스타일 실천형(48.87%), 비실천형(51.13%)으로 분류되었다. 실천형에 속한 중고령 노인은 비실천형에 비해 사회관계가 활발한 특성을 나타내었다. 본 연구에 포함된 머신러닝 알고리즘 중 가장 우수한 성능을 보인 모델은 서포트 벡터 머신으로, 정확도 96%, Receiver Operating Characteristic (ROC) 영역 95%로 나타났다. 본 알고리즘을 바탕으로 개인적 가치의 상대적 중요도를 분석한 결과, 건강한 식단, 건강 매체, 여가활동, 건강 제품 및 머신러닝에 주의를 기울일수록, 해당 가치에 따라 중고령 노인은 건강한 라이프스타일을 실천하는 그룹에 속할 가능성이 큰 것으로 나타났다. 결론 : 본 연구는 중고령 노인의 사회적 관계망을 포함한 건강한 라이프스타일을 유도하기 위해, 건강 식단, 매체, 여가, 제품 및 습관에 대한 가치 향상을 중점적으로 다루는 종합적인 프로그램 및 서비스의 필요성을 시사한다.

Innovative Teaching Technologies as a Way to Increase Students' Competitiveness

  • Olena M. Galynska;Nataliia V. Shkoliar;Zoriana I. Dziubata;Svitlana V. Kravets;Nataliia S. Levchyk
    • International Journal of Computer Science & Network Security
    • /
    • 제24권7호
    • /
    • pp.157-169
    • /
    • 2024
  • The article presents an analysis of innovative teaching technologies as a way to increase students' competitiveness. The author found that innovative technologies in education are information and communication technologies relying on computer-based learning. The structure, content of educational software, organization of Web-space are important when using innovative teaching technologies in English classes. We conducted the study in several stages: comparative analysis, synthesis, classification and systematization of the results of psychological and pedagogical, educational and methodological research; study of legislative acts, periodicals in order to identify the state of the research issue, and determining the directions of its solution, as well as subject, goal and objectives of the study. We used modelling to create situations of foreign language professional communication of future IT specialists. Empirical methods involved questionnaires used for identifying the motives of professional development and determining the features of the educational activities of future IT specialists in the process of training. The methods of mathematical statistics allowed to scientifically describe and systematize the obtained data, to identify the quantitative relationship between the studied phenomena, to analyse and summarize the results. We conducted a socio-psychological study during 2016 - 2019. It involved 255 first- and fourth-year students of National Technical University of Ukraine "Igor Sikorsky Kyiv Poly-technic Institute." Innovative information and communication technologies that improve the educational and cognitive activity of students, as well as increase the level of their knowledge have become important in teaching a foreign language in higher educational institutions. These technologies include MOODLE - Modular Object-Oriented Dynamic Learning Environment, business game, integrated pedagogical technology, case study technology. Thus, the information-rich learning process in combination with the use of innovative technologies, well-organized e-learning, interactive training courses, multimedia tools improves the program of teaching and learning foreign languages in general, and English in particular, improves the level of knowledge of future IT specialists and motivation to study and learn foreign languages, allows students to use a variety of authentic materials. We state that all these factors influence the process of individualization of learning and contribute to the successful mastery of a foreign language.

우리나라 경도 치매 노인의 지역사회 참여 증진을 위한 ICF 기반 Decision Tree for Chatbot 시스템 개발과 효과성 검증 (Development and Efficacy Validation of an ICF-Based Chatbot System to Enhance Community Participation of Elderly Individuals with Mild Dementia in South Korea)

  • 변해원
    • 미래기술융합논문지
    • /
    • 제3권3호
    • /
    • pp.17-27
    • /
    • 2024
  • 본 연구는 우리나라 경도 치매 노인의 지역사회 참여 증진을 위해 국제 기능, 장애 및 건강 분류(ICF) 기반의 챗봇 시스템을 개발하고 평가하였다. 대상자는 경도 치매 진단을 받고 독거 생활을 하는 노인 12명과 가족 돌봄 제공자 15명을 선정하였다. ICF기반 챗봇 시스템의 개발과정은 포괄적인 요구 평가, 시스템 설계, 콘텐츠 생성, 트랜스포머 어텐션 알고리즘을 사용한 자연어 처리 및 사용성 테스트를 포함하였다. ICF기반 챗봇은 개인 맞춤형 활동 추천, 알림 및 신체적, 사회적, 인지적 참여를 지원하는 정보를 제공하도록 설계되었다. 본 연구에서 사용성 테스트 결과 사용자 만족도와 유용성 인식이 높았으며, 지역사회 활동 및 사회적 상호작용에서 유의미한 개선이 확인되었다. 정량 분석 결과, 주간 지역사회 활동이 92% 증가하고 사회적 상호작용이 84% 증가하였다. 정성적 분석(심층 인터뷰)에서는 챗봇의 사용자 친화적 인터페이스, 제안된 활동의 적절성, 그리고 돌봄 제공자의 부담을 줄이는 역할이 강조되었다. 본 연구는 ICF 기반 챗봇 시스템이 경도 치매 노인의 지역사회 참여를 효과적으로 촉진하고 삶의 질을 향상시킬 수 있음을 시사한다.