• 제목/요약/키워드: 실험 시스템

검색결과 22,090건 처리시간 0.054초

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

왼쪽 유방암 세기변조방사선 치료시 Skin Flash 적용에 대한 유용성 평가 (Evaluating efficiency of application the skin flash for left breast IMRT.)

  • 임경달;서석진;이제희
    • 대한방사선치료학회지
    • /
    • 제30권1_2호
    • /
    • pp.49-63
    • /
    • 2018
  • 목 적 : 왼쪽 유방암 세기변조방사선 치료 시 Skin flash를 적용함에 있어 치료계획의 변화를 알아보고, 적용하지 않았을 경우와 적용 했을 시 피부선량의 변화를 비교해 보고자 하였다. 또한 Skin flash를 다양한 두께별로 적용하여 두께별 피부선량의 변화를 비교, 분석해 보고, 적절한 Skin flash의 적용에 대해 알아보고자 한다. 대상 및 방법 : 실험대상은 Anthropomorphic phantom을 이용하였고, 치료계획을 위한 영상획득은 전산화 단층촬영(CT)으로 하였다. 전산화치료계획은 Eclipse(ver 13.7.16, Varian, USA)의 RTP 시스템을 이용하여 2 field hybrid IMRT와 6 field static IMRT의 두 가지 치료계획을 하였다. 위의 치료계획을 바탕으로 각 치료계획마다 Skin flash 두께를 0.5 cm, 1.0 cm, 1.5 cm, 2.0 cm, 2.5 cm으로 변경하여 추가치료계획을 수립하였고, 추가치료계획에 대해 총 MU값과 최대선량의 변화를 알아보았다. 치료 장비는 $VitalBeam^{TM}$(Varian Medical System, USA)의 6 MV를 이용하였다. 측정 장비는 MOSFET(metal oxide semiconductor field-effect transistor)을 이용하였고, 측정지점은 phantom의 왼쪽 유방의 센터를 기준으로 위(1번), 중간(2번), 아래(3번) 세 부위에 위치시켜 피부선량을 측정하였다. 그리고 인위적으로 좌표를 0.5cm 내측(medial), 외측(lateral)으로 이동시켜 피부선량의 변화를 비교 분석하였다. 결 과 : Skin flash를 적용하지 않은 치료계획 2F-hIMRT, 6F-sIMRT의 측정값을 기준선량으로 하였다. 2F-hIMRT의 1번 측정점 206.7 cGy, 2번 186.7 cGy, 3번 222 cGy였고, 6F-sIMRT의 기준값은 1번 192 cGy, 2번 213 cGy, 3번 215 cGy로 측정되었다. 이 기준값들과 비교하여 2F-hIMRT에서 1번 측정점은 Skin flash 2.0 cm, 2.5 cm 적용시 평균 261.3 cGy로 26.1 %diff로 가장 많은 선량차를 보였고, 2번 측정점은 Skin flash 2.0 cm일 때 평균 197.3 cGy, 5.6 %diff의 선량차가 났고, 3번 측정점은 Skin flash 2.5 cm일 때 최대 245.3 cGy, 10.5 %diff였다. 6F-sIMRT에서는 1번 측정지점이 Skin flash 2.0 cm 적용시에 216.3 cGy, 12.7 %diff로 가장 큰 선량차이를 보였고 측정지점별로 Skin flash 2.5 cm 적용시가 아닌 2.0 cm 적용시 선량차가 가장 크게 나타났다. 2F-hIMRT, 6F-sIMRT에서 각각 내측 0.5 cm 이동 후 Skin flash를 사용하지 않았을 때 측정치는 2F는 기준값과 비교시 1번, 3번 측정지점에서 -75.2 %diff, -70.1 %diff 차이였고, 6F는 1번, 2번, 3번 측정 지점에서 -14.8, -12.5, -21.0 %diff로 처방선량에 미치지 못하는 저선량이 측정되었다. 두 치료계획 모두 Skin flash 두께가 커질수록 총 MU와 최대선량이 증가하는 것으로 나타났고, 몇몇 결과를 제외하면 전체적으로 %diff도 증가했다. 모든 조건에서 0.5 cm의 Skin flash 두께 사용이 기준값의 피부선량과 약 20 % 이하의 차이로 가장 적은 것으로 나타났다. 결 론 : 결과에 따라 Skin flash의 두께를 0.5 cm으로 최소화 하는 것이 최대선량이나 MU의 증가를 최소화할 수 있었고, 기준이 되는 치료계획과도 가장 적은 피부선량차이를 보였기에 0.5 cm으로 최소화 하여 적용하는 것이 가장 이상적이라 할 수 있을 것이다. 또한 Skin flash 두께를 무한정 크게 한다고 해서 MU나 최대선량, 피부선량차가 증가하지 않고 수렴한다는 것을 알 수 있었다. 그러므로 유방암 환자의 호흡에 의한 PTV의 변화와 여러 오차의 인자들을 고려한다면 0.5~1.0 cm Skin flash 범위에서 Skin flash를 사용한다면 적용하지 않는 것보다는 더 많은 이점이 있을 것으로 사료된다.

  • PDF

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.

Loop와 HPLC Purification 방법보다 더 높은 비방사능을 보여주는 카트리지 Methylation과 Purification을 이용한 손쉬운 [ 11C]PIB 합성 (Facile [11C]PIB Synthesis Using an On-cartridge Methylation and Purification Showed Higher Specific Activity than Conventional Method Using Loop and High Performance Liquid Chromatography Purification)

  • 이용석;조용현;이홍재;이윤상;정재민
    • 핵의학기술
    • /
    • 제22권2호
    • /
    • pp.67-73
    • /
    • 2018
  • $[^{11}C]PIB$는 베타아밀로이드($A{\beta}\;plague$)라는 변성 단백질에 결합하여 뇌의 기능과 기억력을 서서히 감퇴시키는 비가역적인 질환인 치매를 조기에 감별할 수 있는 대표적인 방사성의약품이다. 지금까지 많은 실험실에서 $[^{11}C]PIB$는 자동화합성장치에서 $[^{11}C]methyl\;iodide$$[^{11}C]methyl\;triflate$를 만든 다음 loop나 vial 방법을 사용하여 methylation을 한 다음 HPLC로 정제를 하는 것이다. 하지만 기존의 보고된 방법은 시간이 오래 걸리며, HPLC와 같은 복잡한 시스템을 필요로 하여 소규모 실험실에서 합성하기에 적합하지 않으며, 최종 product에서 에탄올 함량이 높다는 단점이 있었다. 이러한 단점을 보완하기 위하여 카트리지만을 사용하여 카트리지에서 methylation과 purification을 동시에 실시함으로써 합성 시간을 단축하고, 비방사능이 높고, 낮은 에탄올 함량을 가진 $[^{11}C]PIB$를 합성 가능한지 확인하고자 하였다. 가장 널리 사용하는 카트리지 6종(CM, HLB, Alumina, C18, tC18, tC18 environmental을 선택하여 screening test를 실시하였다. 6-OH-BTA-0 1 mg을 c-HXO에 녹인 다음 6개의 카트리지에 loading를 한 다음 0.5 M MSP(pH 5.1) 20 mL로 정제를 한 다음 최종 fraction을 받아서 analytical HPLC로 전구체 잔류량을 측정한 결과 hydrophobicity가 낮은 계열(CM, HLB, Alumina)의 카트리지에서는 완충액으로 정제를 하였을 때 잔류전구체의 양이 많았으나, 탄소함량이 많은 계열의 카트리지(C18, tC18, tC18 environmental)에서는 잔류전구체의 양이 CM, HLB, Alumina 카트리지에 비하여 상대적으로 적었다. 완충액의 정제 농도와 부피를 최적화 하기 위하여 screening test에서 가장 좋은 결과를 나타낸 C18 series cartridge를 가지고 추가 실험을 진행하였다. 인산완충액 농도를 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 250 mM, 500 mM로 변화시켰으며, 에탄올 함량은 20%와 30%로 하여 용출액을 분석하여서, $[^{11}C]PIB$를 카트리지로 합성하기 위한 최적의 조합은 tC18 environmental cartridge와 0.5 M MSP 20 mL인 것을 알 수 있었다. 기존에 보고된 방법과 cartridge를 비교한 결과, 합성시간에서는 각각 15 ~ 18min, 8 ~ 9 min이 소요되었으며, product activity는 각각 $4.1{\pm}1.4\;GBq$ (n=41), $3.8{\pm}0.9\;GBq$ (n=3), 방사화학적 수율(based on HPLC analysis of the crude product)에서는 $13.9{\pm}4.4%$ (n=41), $12.3{\pm}2.2%$ (n=3)로 별다른 차이가 없었으며, 비방사능에 있어서는 HPLC purification method가 $78.7{\pm}39.7\;GBq/{\mu}mol$ (n=41), cartridge method가 $420.6{\pm}20.4\;GBq/{\mu}mol$ (n=3)로 카트리지 방법이 기존 방법보다 더 좋은 결과를 나타내었다. 또한, 잔류 용매(c-HXO)도 vial or loop method와 별다른 차이가 없었으며, 에탄올 함량에 있어서는 70%(기존 방법)에서 30%(카트리지 방법)로 두 배 이상 함량이 적다는 사실을 알 수 있었다. 지금까지 알아본바와 같이 cartridge method는 reported method(HPLC purification)에 비하여 더 향상된 결과를 보여준다는 사실을 확인하였다.

인공지능이 의사결정에 미치는 영향에 관한 연구 : 인간과 인공지능의 협업 및 의사결정자의 성격 특성을 중심으로 (A Study on the Impact of Artificial Intelligence on Decision Making : Focusing on Human-AI Collaboration and Decision-Maker's Personality Trait)

  • 이정선;서보밀;권영옥
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.231-252
    • /
    • 2021
  • 인공지능(Artificial Intelligence)은 미래를 가장 크게 변화시킬 핵심 동력으로 산업 전반과 개인의 일상생활에 다양한 형태로 영향을 미치고 있다. 무엇보다 활용 가능한 데이터가 증가함에 따라 더욱더 많은 기업과 개인들이 인공지능 기술을 이용하여 데이터로부터 유용한 정보를 추출하고 이를 의사결정에 활용하고 있다. 인공지능에 관한 기존 연구는 모방 가능한 업무의 자동화에 초점을 두고 있으나, 인간을 배제한 자동화는 장점 못지않게 알고리즘 편향(Algorithms bias)으로 발생되는 오류나 자율성(Autonomy)의 한계점, 그리고 일자리 대체 등 사회적 부작용을 보여주고 있다. 최근 들어, 인간지능의 강화를 위한 증강 지능 (Augmented intelligence)으로서 인간과 인공지능의 협업에 관한 연구가 주목을 받고 있으며 기업도 관심을 가지기 시작하였다. 본 연구는 의사결정을 위해 조언(Advice)을 제공하는 조언자의 유형을 인간, 인공지능, 그리고 인간과 인공지능 협업의 세 가지로 나누고, 조언자의 유형과 의사결정자의 성격 특성이 의사결정에 미치는 영향을 살펴보았다. 311명의 실험자를 대상으로 사진 속 얼굴을 보고 나이를 예측하는 업무를 진행하였으며, 연구 결과 의사결정자가 조언활용을 하려면 먼저 조언의 유용성을 높게 인지하여하는 것으로 나타났다. 또한 의사결정자의 성격 특성이 조언자 유형별로 조언의 유용성을 인지하고 조언을 활용하는 데에 미치는 영향을 살펴본 결과, 인간과 인공지능의 협업 형태인 경우 의사결정자의 성격 특성에 무관하게 조언의 유용성을 더 높게 인지하고 적극적으로 조언을 활용하는 것으로 나타났다. 인공지능 단독으로 활용될 경우에는 성격 특성 중 성실성과 외향성이 강하고 신경증이 낮은 의사결정자가 조언의 유용성을 더 높게 인지하고 조언을 활용하는 것으로 나타났다. 본 연구는 인공지능의 역할을 의사결정과 판단(Decision Making and Judgment) 연구 분야의 조언자의 역할로 보고 관련 연구를 확장하였다는데 학문적 의의가 있으며, 기업이 인공지능 활용 역량을 제고하기 위해 고려해야 할 점들을 제시하였다는데 실무적 의의가 있다.

Hypopharynx Cancer의 VMAT 치료 시 Neck 3D Bolus 적용에 대한 유용성 평가 (The Application of 3D Bolus with Neck in the Treatment of Hypopharynx Cancer in VMAT)

  • 안예찬;김진만;김찬양;김종식;박용철
    • 대한방사선치료학회지
    • /
    • 제32권
    • /
    • pp.41-52
    • /
    • 2020
  • 목 적: Hypopharynx Cancer의 VMAT 치료 시 Neck 부분에 Commercial Bolus(이하 CB)와 3D Printing 기술로 제작한 3D Bolus를 각각 적용한 두 치료 계획을 비교함으로써 3D Bolus 적용의 선량학적 유용성, setup 재현성 및 효율성을 알아보고 임상적 적용 가능성을 평가하고자 한다. 대상 및 방법: CB를 적용한 RANDO phantom의 CT image를 바탕으로 3D Bolus를 동일한 형태로 제작하였다. 3D Bolus는 OMG SLA 660 Printer, MaterialiseMagics software를 이용하여 SLA기법을 통해 밀도 1.2 g/㎤의 폴리우레탄 아크릴레이트 수지로 출력하였다. CB와 3D Bolus를 적용한 두 CT image를 바탕으로 Hypopharynx Cancer의 VMAT 치료를 가정하여 치료 계획을 수립하였다. 수립한 두 치료 계획을 각각 18회에 걸쳐 CBCT image를 획득하였고, 매 회 setup time을 측정하여 치료 효율성을 평가하였다. 획득한 CBCT image를 바탕으로 전산화 치료계획 시스템 Pinnacle을 통해 Adaptive Plan을 진행함으로써 Target, 정상 장기 선량 평가와 Bolus Volume의 변화를 평가하였다. 결 과: 각 치료 계획에 대한 setup time은 CB 적용 치료 계획에 비해 3D Bolus 적용 치료 계획에서 평균 28 sec 감소하였다. 치료 전 기간 내 Bolus Volume 변화는 CB Initial Plan 83.9㎤에서 86.1±2.70㎤, 3D Bolus Initial Plan 92.2㎤에서 99.8±0.46㎤로 나타났다. CTV Min Value의 변화는 CB Initial Plan 191.6cGy에서 167.4±19.38cGy, 3D Bolus Initial Plan 167.3cGy에서 149.5±18.27cGy로 나타났다. CTV Mean Value의 변화는 CB Initial Plan 227.1cGy에서 228.3±0.38cGy, 3D Bolus Initial Plan 225.9cGy에서 227.7±0.30cGy로 나타났다. PTV Min Value의 변화는 CB Initial Plan 128.5cGy에서 74.9±19.47cGy, 3D Bolus Initial Plan 139.9cGy에서 83.2±12.92cGy로 나타났다. PTV Mean Value의 변화는 CB Initial Plan 225.4cGy에서 226.2±0.83cGy, 3D Bolus Initial Plan 224.1cGy에서 225.8±0.33cGy로 나타났다. 정상 장기 Spinal Cord에 대한 Max Value는 매 회 평균 135.6cGy로 동일하게 나타났다. 결 론: 본 논문의 실험 결과를 통해 불균등한 체표면에 대한 3D Bolus의 적용이 Commercial Bolus 적용에 비해 선량학적으로 유용하고 setup 재현성 및 효율성 또한 우수함을 알 수 있었다. 추후 3D Printing 재료의 다양성에 대한 연구와 함께 추가적인 사례 연구가 진행된다면 방사선 치료 분야에서 3D Bolus의 적용이 더욱 활발하게 진행될 것으로 사료된다.

대학생의 학창경험이 사회 진출에 미치는 영향: 대학생활 활동 로그분석을 중심으로 (School Experiences and the Next Gate Path : An analysis of Univ. Student activity log)

  • 이은주;박도형
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.149-171
    • /
    • 2020
  • 대학생 시기는 실질적으로 직업선택을 해야 하는 시기이다. 우리 사회가 빠르게 고도로 발달하는 만큼, 직업은 다양화, 세분화, 전문화되어 대학생들의 취업 준비기간은 또한 갈수록 길어지고 있다. 본 연구는 대학생들이 학교 내외에서 하는 경험하는 다양한 활동들이 취업에 어떤 영향이 있을지 대학생들의 로그데이터를 중심으로 분석해 보았다. 실험을 위하여 학생들의 다양한 활동을 체계적으로 분류하고 활동 데이터를 6개의 핵심역량(직무전문성강화 역량, 리더십 및 팀웍 역량, 세계화 역량, 직무몰입 역량, 직업탐색 역량, 자율이행역량)으로 구분하였고, 여기서 구분된 6개의 역량 값이 취업여부(취업그룹, 미취업그룹)에 미치는 영향을 분석하였다. 분석 결과 6개의 역량 모두 취업집단과 미취업집단의 수준차이가 유의한 것을 확인할 수 있어 학교에서의 활동은 취업에 유의미함을 유추할 수 있었다. 다음으로 6개의 역량이 취업의 질적성과에 미치는 영향을 분석하기 위하여 6개의 역량수준을 상·하로 나누고, 첫연봉액을 기준으로 6개의 그룹을 만든 후 관계를 확인해 보았는데, 그 결과 6개의 역량 중 세계화역량, 직업탐색역량, 자율이행역량 수준이 높은 학생이 연봉을 기준으로 한 취업성과 또한 높은 것으로 확인되었다. 본 연구의 이론적 공헌은 다음과 같다. 첫 번째, 학창경험으로부터 추출할 수 있는 역량을 인사조직관리분야의 역량과 연결하며, 개인의 경력성공을 위해 대학생으로서 필요한 역량을 직업탐색역량과 자율이행역량을 추가하였다는 점이다. 두 번째, 활동로그의 실데이터 기반으로 각각의 역량을 측정하고 결과변수와 검증을 한 점이다. 세 번째, 양적성과(취업률)뿐만 아니라 질적성과(연봉수준)를 분석한 점이다. 본 연구의 실무적 활용은 다음과 같다. 첫 번째, 대학생들의 경력개발계획 수립 시 가이드가 될 수 있다. 전략이 없거나 균형을 갖추지 못한 또는 과도한 스펙을 쌓기는 지양하고 직업세계와 직무에 대한 분석을 바탕으로 자신의 강점을 표현할 수 있는 취업준비가 필요하다. 두 번째, 학교와 기업, 지자체, 정부 등 대학생들을 위한 행사를 기획하는 담당자는 대학생들이 필요로 하는 경험을 설계할 본 연구에서 제시한 6대 역량을 참고할 수 있다. 이벤트의 수요자인 대학생이 필요한 역량을 키우면서 하면서 각 기관의 목적을 더할 때 수요자와 공급자 모두 만족스러운 결과를 만들 수 있다. 세 번째, 디지털 대전환 시대, 국가의 균형발전을 구상하는 정부의 정책담당자는 대학생들의 호기심과 에너지를 대학생들의 역량개발과 국가의 균형발전을 함께 성취하는 방향으로 정책을 만들 수 있다. 기존에 없던 플랫폼서비스를 시도하고, 기존의 아날로그 상품이나 서비스와 기업문화를 디지털화 하는 데에는 많은 인력이 필요하며 디지털세대인 현 대학생들의 활약은 전 산업에서 촉매가 될 뿐 아니라 성공적인 경력개발을 위한 대학생들에게도 필요한 경험이라 사료된다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

딥러닝 오픈소스 프레임워크의 사례연구를 통한 도입 전략 도출 (Deriving adoption strategies of deep learning open source framework through case studies)

  • 최은주;이준영;한인구
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.27-65
    • /
    • 2020
  • 많은 정보통신기술 기업들은 자체적으로 개발한 인공지능 기술을 오픈소스로 공개하였다. 예를 들어, 구글의 TensorFlow, 페이스북의 PyTorch, 마이크로소프트의 CNTK 등 여러 기업들은 자신들의 인공지능 기술들을 공개하고 있다. 이처럼 대중에게 딥러닝 오픈소스 소프트웨어를 공개함으로써 개발자 커뮤니티와의 관계와 인공지능 생태계를 강화하고, 사용자들의 실험, 적용, 개선을 얻을 수 있다. 이에 따라 머신러닝 분야는 급속히 성장하고 있고, 개발자들 또한 여러가지 학습 알고리즘을 재생산하여 각 영역에 활용하고 있다. 하지만 오픈소스 소프트웨어에 대한 다양한 분석들이 이루어진 데 반해, 실제 산업현장에서 딥러닝 오픈소스 소프트웨어를 개발하거나 활용하는데 유용한 연구 결과는 미흡한 실정이다. 따라서 본 연구에서는 딥러닝 프레임워크 사례연구를 통해 해당 프레임워크의 도입 전략을 도출하고자 한다. 기술-조직-환경 프레임워크를 기반으로 기존의 오픈 소스 소프트웨어 도입과 관련된 연구들을 리뷰하고, 이를 바탕으로 두 기업의 성공 사례와 한 기업의 실패 사례를 포함한 총 3 가지 기업의 도입 사례 분석을 통해 딥러닝 프레임워크 도입을 위한 중요한 5가지 성공 요인을 도출하였다: 팀 내 개발자의 지식과 전문성, 하드웨어(GPU) 환경, 데이터 전사 협력 체계, 딥러닝 프레임워크 플랫폼, 딥러닝 프레임워크 도구 서비스. 그리고 도출한 성공 요인을 실현하기 위한 딥러닝 프레임워크의 단계적 도입 전략을 제안하였다: 프로젝트 문제 정의, 딥러닝 방법론이 적합한 기법인지 확인, 딥러닝 프레임워크가 적합한 도구인지 확인, 기업의 딥러닝 프레임워크 사용, 기업의 딥러닝 프레임워크 확산. 본 연구를 통해 각 산업과 사업의 니즈에 따라, 딥러닝 프레임워크를 개발하거나 활용하고자 하는 기업에게 전략적인 시사점을 제공할 수 있을 것이라 기대된다.

데이터마이닝을 활용한 기업 R&D역량 특성에 관한 탐색 연구 (A Study on the Characteristics of Enterprise R&D Capabilities Using Data Mining)

  • 김상국;임정선;박완
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.1-21
    • /
    • 2021
  • 글로벌 경영환경 변화로 기술개발과 시장니즈의 불확실성이 커지고 기업 간 상호 경쟁이 심화되면서 개별 기업들의 연구개발 활동에 대한 관심과 요구가 증가하고 있다. 이러한 환경변화에 대응하기 위하여 연구개발 기업들은 설비투자에 더욱 신중을 가하면서 연구개발의 질적인 경쟁력을 제고시키기 위한 수단 중 하나로 연구개발 투자를 강화하고 있다. 결과적으로 설비나 연구개발 투자 요소는 연구개발 기업들의 입장에서는 미래 불확실성을 떠안아야하는 부담이 될 수 밖에 없다. 단지 연구개발 역량을 제고시키기 위한 수단으로 연구개발 투자를 증가시키는 경영 전략은 기업성과측면에서 불확실성이 높은 것이 사실이다. 본 연구에서는 데이터마이닝 기법을 활용하여 기업들의 연구개발 역량에 영향을 주는 특성들을 기술경영능력, 연구개발능력, 그리고 기업분류 속성 관점에서 탐색하고 이러한 개별 요인들이 연구개발 역량의 수준에 따라 나타나는 특성들을 탐색하였다. 이를 위해서 국내 연구개발 기업 전체를 대상으로 증거데이터에 근거해 군집분석과 실험결과를 제시하였다. 상기의 3개 관점마다 세부 평가지표를 각각 7개, 2개, 4개로 구성하여 해당 영역에서의 개별적인 수준을 정량적으로 측정하고자 하였다. 기술경영능력과 연구개발능력의 경우 현행 기술력 평가기관들이 주도적으로 활용하고 있는 소항목 평가지표를 참조하였으며, 이때 정량적으로 자료 확보가능한지 여부를 고려하여 최종적인 세부 평가지표를 새롭게 구성하였다. 기업분류 속성의 경우에는 가장 기본적인 기업 분류 프로파일 정보를 고려하여 구성하였다. 특히 연구개발 역량수준의 동질성 파악을 위해서 기술경영능력과 연구개발능력의 세부평가지표를 활용하여 개별기업별 종합점수를 부여하였으며, 이때 역량수준을 5개의 등급으로 분류하여 군집분석 결과와 비교하였다. 분석된 군집과 역량수준 등급과의 비교평가에 따른 의미를 부여하기 위해서 군집별로 연구개발 역량수준이 높은 경향과 낮은 경향이 존재하는 군집들을 탐색하였다. 이후 해당 군집에서 세부 평가지표에 따른 특징들을 분석하였다. 이와 같은 연구수행 방법을 통해 연구 개발 역량수준이 높은 군집이 2개, 낮은 군집이 1개로 분석되었으며, 나머지 2개의 군집들은 역량수준이 거의 높은 발생 빈도로 유사하게 나타났다. 결과적으로 본 연구에서는 역량수준이 높은 2개 군집과 낮은 1개의 군집들을 대상으로 세부 평가지표에 따른 개별적 특징들을 분석하였다. 본 연구의 결과가 제시하고 있는 시사점은 기술변화 속도와 시장수요의 변화에 효과적으로 대응할 수 있는 전문 경영자의 교체주기가 빠를수록 연구개발 역량 제고에 기여할 가능성이 높다는 점이다. 개인기업의 경우에 법인기업으로의 전환을 통해 연구개발 인력들의 기업에 대한 소속감을 제고시킴으로써 연구개발 역량의 투입강도를 높일 필요가 있으며, 조직적 측면에서도 팀단위의 조직구성을 통해 책임과 권한의 정확성을 제공할 필요가 있다는 점이다. 기술상용화 실적건수나 기술인증건수는 역량제고에 기여하는 경우와 그렇지 않은 경우 모두 발생되고 있어, 경영자 입장에서 연구개발 역량제고를 위한 중요 인자로 검토하는데 한계가 있는 것으로 확인되었다. 마지막으로 실용신안출원의 경험 여부는 연구개발 역량에 중요한 영향을 미치는 요인으로 파악되어, 연구개발 역량 제고를 위해서는 실용신안출원 장려를 위한 동기부여를 제공할 필요성을 확인하였다. 이처럼 본 연구결과는 개별 기업들의 연구개발 역량 제고를 위한 기업 경영전략의 중요한 시사점을 제공할 수 있을 것으로 기대된다.