• 제목/요약/키워드: CASE

검색결과 106,685건 처리시간 0.118초

개인정보보호 분야의 연구자 네트워크와 성과 평가 프레임워크: 소셜 네트워크 분석을 중심으로 (The Framework of Research Network and Performance Evaluation on Personal Information Security: Social Network Analysis Perspective)

  • 김민수;최재원;김현진
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.177-193
    • /
    • 2014
  • 개인정보 분야에서의 다양한 정보 보안 이슈가 발생함에 따라 해당 분야의 전문가를 확인하기 위한 프레임워크는 매우 중요한 영역이 되었다. 전문가 탐색과정은 주로 연구 업적 등을 통한 주관적인 평가가 일반적이지만 보다 객관적인 방식을 통한 선정이 매우 중요하다. 소셜 네트워크 분석기법의 응용이 다양한 영역에서 활용됨에 따라 본 연구는 개인정보보호분야의 전문가를 확인하고 해당 전문가들의 연구실적을 판단하기 위한 분석 프레임워크를 제시하고자 하였다. 본 연구는 연구 목적에 따라 개인정보보호 연구영역의 연구성과 자료를 바탕으로 소셜 네트워크 분석을 실시하고 핵심연구자의 성과를 분석하였다. 수집된 데이터는 연구의 공저자, 발행기관, 소속기관 등의 네트워크 구성에 활용되어 핵심전문가 집단을 관리하기 위한 프레임워크를 제시하였다. 본 연구는 NDSL에서 최근 5년 동안 발표된 논문들을 중심으로 자료를 수집하였다. 연구자들이 학술 정보를 교환하는 정기 간행물인 학술지를 바탕으로 연구 네트워크를 형성하는 네트워크 자료를 수집함으로써 연구활동에 대한 정보를 분석할 수 있었다. 일반적으로 연구자들은 연구 결과를 논문으로 발표하고, 발표된 논문들이 다수의 관련 분야 전문가들에게 공유된다는 점에서 학술연구지는 연구자들의 지식관련 의사소통 공간이며 지식의 구조화에 핵심적인 역할을 수행한다. 그에 따라 본 연구의 연구 대상 분야로 설정한 개인정보보호 분야의 연구 구조를 이해하기 위해 국내에서 발표된 관련 분야의 논문들을 연구 대상으로 자료가 수집되었다. 특히 자료의 선별 기준은 국내 최대의 데이터베이스를 보유하고 있는 NDSL에서 개인정보보호 관련 키워드를 보유한 논문 데이터를 수집 및 정제하여 분석 자료로 사용하였다. 2005년부터 2013년까지 약 2,000개의 연구결과 중 주제 관련성, 공저자 추출 등을 수집하였다. 데이터 수집 이후 연구 분석을 위한 데이터 처리를 통하여 통해 총 784개의 논문을 선정하고 분석대상으로 확정하였다. 분석 결과, 개인정보보호 연구영역의 전문가 집단을 이용한 연구논문 성과에 대한 분석은 핵심 연구자들을 추출해내고 전문가 집단을 관리하는 데 도움을 제공할 수 있다. 특히 소속집단 및 연구논문 발행기관을 분석함으로써 개인정보보호 연구영역에서 확인되지 않았던 연구자들의 연구 논문 게재의 공저자 네트워크가 매우 밀접함을 확인할 수 있다. 또한 연구논문의 발행기관 및 소속집단의 특성을 추출함으로써 개인정보보호 영역의 전문가 평가지표로서 소셜 네트워크 지표들의 활용가능성을 확인하였다.

오피니언 마이닝과 네트워크 분석을 활용한 상품 커뮤니티 분석: 영화 흥행성과 예측 사례 (Product Community Analysis Using Opinion Mining and Network Analysis: Movie Performance Prediction Case)

  • 진위;김정수;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.49-65
    • /
    • 2014
  • 구전(WOM: Word of Mouth)는 주변 사람들에게 상품에 대한 경험을 입에서 입으로 전달하는 현상을 말하며 소셜 미디어의 발전으로 온라인 구전(eWOM: Electronic Word of Mouth) 형태로 발전하였다. 구전 효과의 중요성으로 인해서 대부분의 기업들의 자사의 상품이나 서비스에 대한 온라인 구전에 촉각을 세우고 있으며, 특히 영화와 같은 경험재의 경우에는 그 영향력이 더욱 크다. 본 연구에서는 영화 커뮤니티에 대한 사회 네트워크 분석을 통해서 영화 흥행성과 지표인 매출에 미치는 영향요인을 규명하고자 한다. 영화 흥행성과 연구들에서 주요하게 다루어진 영화에 대한 구전의 크기(volume)와 방향성(valence)과 같은 구전 요인들을 추가하여, 구전 네트워크의 중심성 척도를 영향 요인에 고려하였다. 구전의 크기, 방향성, 그리고 3가지 중심성 척도(연결 중심성, 매개 중심성, 근접 중심성)의 최종 영화 매출에 영향 관계를 가설로 설정하였다. 제시한 연구 모형을 검증하기 위하여 대표적인 온라인 영화 커뮤니티 사이트인 IMDb(Internet Movie Database)에서 영화 구전 데이터를 수집하였고, Box-Office-Mojo사이트에서 영화 매출 데이터를 수집하였다. 2012년 9월부터 1년 동안, 주간 Top-10에 포함된 적이 있는 영화들을 대상으로 하였으며, 총 103개의 영화가 선정되어 이 영화들에 대한 메타 데이터와 커뮤니티 데이터가 수집되었다. 영화 커뮤니티 네트워크는 평가자들간의 댓글 관계를 기초로 구축하였다. 본 연구에서 사용한 3가지 중심성 척도는 사회 네트워크 분석 도구인 NodeXL을 사용하여 계산되었으며, 각 영화별 커뮤니티 참여자들의 중심성 척도의 평균값을 활용하였다. 가설 검증의 사전 분석을 위한 상관관계 분석에서는 3가지 중심성 척도간에 상관 관계가 높은 것으로 파악되어서, 각각에 대하여 별도로 회귀분석을 수행하였다. 분석 결과, 기존 연구와 일관성 있게 구전의 크기와 방향성은 영화 성과지표인 최종 매출에 긍정적인 영향을 미치는 것으로 파악되었다. 또한 구전 네트워크 내의 참여자 매개중심성 평균은 영화의 최종 매출에 영향을 미치는 것으로 파악되었다. 하지만 연결중심성과 근접중심성은 최종 매출에 영향을 주지 못하는 것으로 나타났다.

좌측 유방암의 방사선치료 자세와 선량인자의 상관관계 분석 (Correlation analysis of radiation therapy position and dose factors for left breast cancer)

  • 전재완;박철우;홍종수;진성진;강정훈
    • 대한방사선치료학회지
    • /
    • 제29권1호
    • /
    • pp.37-48
    • /
    • 2017
  • 목 적: 방사선치료의 가장 기본적인 조건은 정상조직의 불필요한 피폭을 방지하는 것이다. 유방암의 경우는 폐와 심장에 조사되는 선량이 중요하게 평가되는 인자이다. 따라서 유방암 방사선치료 자세에 따른 정상조직에 조사되는 선량을 비교하고 그 연관성을 상관관계 분석을 통하여 결과를 확인하여 보다 효과적인 유방암 방사선 치료방법을 모색하고자 한다. 대상 및 방법: 본원을 내원한 좌측 유방암 환자 30명을 대상으로 Supine, Prone Position에서 CT image를 획득하였다. Eclipse Treatment Planning System(Version 11, USA)을 이용하여 전산화치료계획을 수립하였다. DVH(Dose Volume Histogram)을 통해 Position 별로 정상조직에 조사된 선량을 비교하였다. 그 결과를 바탕으로 SPSS(Version 18)을 이용하여 각 정상조직의 선량인자를 통계분석하고 항목 간 상관관계 분석 및 독립표본 t-test를 통하여 그 연관성을 알아보았다. 그리고 MIRADA RTx(Version Advanced 1.6, UK)를 이용하여 HI(Homogeneity Index)와 CI(Conformity Index)를 Supine, Prone Position에서 값을 구하고 비교하였다. 결 과: 유방암의 전산화치료계획의 결과 폐의 경우는 Supine Position에서 V20은 $16.5{\pm}2.6%$, V30은 $13.8{\pm}2.2%$, Mean dose는 $779.1{\pm}135.9cGy$(Absolute value)를 보였다. Prone Position은 위 순서대로 $3.1{\pm}2.2%$, $1.8{\pm}1.7%$, $241.4{\pm}138.3cGy$를 보였다. Prone Position이 전반적으로 낮은 선량을 나타내었고 평균선량 537.7 cGy가 더 적게 폐에 조사되었다. 심장의 경우에는 Supine, Prone 순서대로 V30은 $8.1{\pm}2.6%$, $5.1{\pm}2.5%$, Mean dose는 $594.9{\pm}225.3cGy$, $408{\pm}183.6cGy$를 보였다. Prone Position에서 평균선량 182.6 cGy가 더 적게 조사된다는 것을 확인하였다. 통계분석 결과 신뢰도 분석지표인 Cronbach's Alpha value는 0.563이였고 변수간의 상관관계분석 결과 치료자세와 폐의 선량평가인자는 대략 0.89 이상으로 그 상관관계가 높았다. 반면 심장의 경우는 V30은 0.488, Mean dose는 0.418로 상관관계가 다소 적었다. 마지막으로 독립표본 t-test 결과 치료자세와 폐, 심장의 선량평가인자가 신뢰수준 99 %에서 모두 유의하게 나타났다($p-value{\leq}0.05$). 결 론: 현재 방사선치료는 최첨단 선형가속기와 다양화된 전산화치료계획 기술이 개발되고 있다. 이 발전의 기본전제 조건은 PTV(Planning Target Volume) 주위의 정상조직 보호라고 생각한다. 물론 유방암 환자를 Prone Position에서 치료하면 Set-up의 재현성 문제와 다소 많은 시간이 소요되지만 이 실험결과에서 보듯이 Prone Position에서 폐와 심장에 들어가는 선량을 줄일 수 있으며 그 연관관계도 의미가 있다는 것을 확인하였다. 결론적으로 Prone Position에서 충분한 치료시간을 확보하고 정확한 치료부위 확인이 이루어진다면 환자에게 보다 좋은 방사선치료를 제공할 수 있다고 생각된다.

  • PDF

포장재배(圃場栽培) 수도(水稻)의 영양진단(營養診斷) -1. 지엽분석(止葉分析)에 의(依)한 진단(診斷)- (Diagnosis of the Field-Grown Rice Plant -[1] Diagnostic Criteria by Flag Leaf Analysis-)

  • 박훈
    • Applied Biological Chemistry
    • /
    • 제16권1호
    • /
    • pp.18-30
    • /
    • 1973
  • 삼요소(三要素) 단순시험(單純試驗) 포장(圃場)을 대상으로 지엽(止葉) 및 하위엽(下位葉) 분석(分析)에 의(依)한 수도(水稻)의 영양진단(營養診斷) 척도(尺度)를 찾고자 하했던 바 다음과 같은 결과(結果)를 얻었다. 1. 어떤 영양(營養)이 결핍(缺定)한 토양(土壞)의 무비구(無認區) 결핍구(缺乏區) 및 시비구(施肥區)에서 유인결핍(誘引缺乏), 염계결핍(鹽界缺乏), 잠재결핍(潛在缺乏) 치사흡수(侈奢吸收) 과잉장해(過剩障害)의 제단계(諸段階) 척도(尺度)를 추정(推定)할 수 있었다. 2. 수확기(收穫期) 지엽중(止葉中) 질소함량(窒素含量)이 1% 이하(以下)이면 유인결핍(誘引缺乏)이고 $1.0{\sim}1.2%가 염계결핍(鹽界缺乏)$1.2{\sim}1.6%이 잠재결핍(潛在缺乏)$1.6{\sim}1.9%가 만족(滿足)영역으로 치사흡수단계(侈奢吸收段階)이고 1.9 이상(以上)에서 장해(障害)를 받는다. 3. 인산(燐酸)(P_2O_5)$은 각단계(各段階)가 0.3% 이하 $0.3{\sim}0.4 $0.4{\sim}0.550.55 이상으로 나타났으며 과잉장해수준(過剩障害水準)은 알 수 없었다. 4. 규산(硅酸)$(SiO_2)$은 4%이하 $4{\sim}6 $6{\sim}11및 11이상(以上)으로 나타났다. 5. 가리(加里)$(K_2O)$는 0.5% 이하(以下) $0.5{\sim}0.9 $0.9{\sim}1.2 $1.2{\sim}1.4 및 1.4 이상(以上)의 장해(障害)영역을 보였다. 6. 지엽중(止葉中) 가리(加里)는 질소(窒素)를 수생육(穗生育)에 기여케한 결과(結果)로 지엽중(止葉中) 질소함량(窒素含量)을 낮추고 지엽중(止葉中)을 줄인다. 7. 인산(燐酸)은 Mg>Si>Mn>K의 순(順)으로 하엽(下葉)에서 지엽(止葉)으로의 이동(移動)을 촉진(促進)하고 Ca>N의 순으로 저지(沮止)하는 반면 가리(加里)는 Mn>Ca의 순으로 촉진(促進)하고 Ma>Si>N의 순(順) 으로 저지(沮止)하였다. 8. 양분전류촉진지수(養分轉流促進指數)는 $(F_2L_1-F_1L_2){\cdot}100/F_1L_1$으로 계산할 수 있는데 한 양분(養分)의 시비량(施肥量)이 타양분(他養分)의 이동(移動)에 대(對)한 영향의 지표(指標)로 적합(適合)하였다. 여기서 F 와 L 은 지엽(止葉) 및 하엽중(下葉中)의 양분농도(養分濃度)를, 2는 비료(肥料)의 시비수준(施賂水準)을 의미(意味)한다. 9. 적기재배(適期栽培)에 비(比)하여 조기재배(早期栽培)는 엽중(葉中) $SiO_2$의 함량(含量)이 하엽(下葉)보다 지엽(止葉)에서 낮아 규산(珪酸)의 흡수(吸收) 및 이동(移動)이 불량(不良)한 것으로 나타났다. 10. 가리결핍답(加里缺乏畓)에서 나타난 호마엽고병(胡麻葉枯病)은 지엽중(止葉中) 가리함량(加里含量)보다 $SiO_2$ 함량(含量)에 더 깊은 관계를 보였다11. 생육(生育)이 불량(不良)한 저수답(低收沓) 수도(水稻)의 엽위별(葉位別) 분석(分析)은 주인(主脚) 영양(營養)을 밝혀를 뿐만 아니라 $2{\sim}3$개의 기타 영양장해(營養障害)가 수반되고 있음을 나타내었다. 12. 문제지역(問遷地域)의 영양장해(營養障害)는 모두 대량원소(大量元素)가 일차적(一次的) 요인(要圍)이며 미량원소(微量元素)는 이차적(二次約)일 것으로 추정(推定)되었다.

  • PDF

단위유량도와 비수갑문 단면 및 방조제 축조곡선 결정을 위한 조속계산 (Calculation of Unit Hydrograph from Discharge Curve, Determination of Sluice Dimension and Tidal Computation for Determination of the Closure curve)

  • 최귀열
    • 한국농공학회지
    • /
    • 제7권1호
    • /
    • pp.861-876
    • /
    • 1965
  • During my stay in the Netherlands, I have studied the following, primarily in relation to the Mokpo Yong-san project which had been studied by the NEDECO for a feasibility report. 1. Unit hydrograph at Naju There are many ways to make unit hydrograph, but I want explain here to make unit hydrograph from the- actual run of curve at Naju. A discharge curve made from one rain storm depends on rainfall intensity per houre After finriing hydrograph every two hours, we will get two-hour unit hydrograph to devide each ordinate of the two-hour hydrograph by the rainfall intensity. I have used one storm from June 24 to June 26, 1963, recording a rainfall intensity of average 9. 4 mm per hour for 12 hours. If several rain gage stations had already been established in the catchment area. above Naju prior to this storm, I could have gathered accurate data on rainfall intensity throughout the catchment area. As it was, I used I the automatic rain gage record of the Mokpo I moteorological station to determine the rainfall lntensity. In order. to develop the unit ~Ydrograph at Naju, I subtracted the basic flow from the total runoff flow. I also tried to keed the difference between the calculated discharge amount and the measured discharge less than 1O~ The discharge period. of an unit graph depends on the length of the catchment area. 2. Determination of sluice dimension Acoording to principles of design presently used in our country, a one-day storm with a frequency of 20 years must be discharged in 8 hours. These design criteria are not adequate, and several dams have washed out in the past years. The design of the spillway and sluice dimensions must be based on the maximun peak discharge flowing into the reservoir to avoid crop and structure damages. The total flow into the reservoir is the summation of flow described by the Mokpo hydrograph, the basic flow from all the catchment areas and the rainfall on the reservoir area. To calculate the amount of water discharged through the sluiceCper half hour), the average head during that interval must be known. This can be calculated from the known water level outside the sluiceCdetermined by the tide) and from an estimated water level inside the reservoir at the end of each time interval. The total amount of water discharged through the sluice can be calculated from this average head, the time interval and the cross-sectional area of' the sluice. From the inflow into the .reservoir and the outflow through the sluice gates I calculated the change in the volume of water stored in the reservoir at half-hour intervals. From the stored volume of water and the known storage capacity of the reservoir, I was able to calculate the water level in the reservoir. The Calculated water level in the reservoir must be the same as the estimated water level. Mean stand tide will be adequate to use for determining the sluice dimension because spring tide is worse case and neap tide is best condition for the I result of the calculatio 3. Tidal computation for determination of the closure curve. During the construction of a dam, whether by building up of a succession of horizontael layers or by building in from both sides, the velocity of the water flowinii through the closing gapwill increase, because of the gradual decrease in the cross sectional area of the gap. 1 calculated the . velocities in the closing gap during flood and ebb for the first mentioned method of construction until the cross-sectional area has been reduced to about 25% of the original area, the change in tidal movement within the reservoir being negligible. Up to that point, the increase of the velocity is more or less hyperbolic. During the closing of the last 25 % of the gap, less water can flow out of the reservoir. This causes a rise of the mean water level of the reservoir. The difference in hydraulic head is then no longer negligible and must be taken into account. When, during the course of construction. the submerged weir become a free weir the critical flow occurs. The critical flow is that point, during either ebb or flood, at which the velocity reaches a maximum. When the dam is raised further. the velocity decreases because of the decrease\ulcorner in the height of the water above the weir. The calculation of the currents and velocities for a stage in the closure of the final gap is done in the following manner; Using an average tide with a neglible daily quantity, I estimated the water level on the pustream side of. the dam (inner water level). I determined the current through the gap for each hour by multiplying the storage area by the increment of the rise in water level. The velocity at a given moment can be determined from the calcalated current in m3/sec, and the cross-sectional area at that moment. At the same time from the difference between inner water level and tidal level (outer water level) the velocity can be calculated with the formula $h= \frac{V^2}{2g}$ and must be equal to the velocity detertnined from the current. If there is a difference in velocity, a new estimate of the inner water level must be made and entire procedure should be repeated. When the higher water level is equal to or more than 2/3 times the difference between the lower water level and the crest of the dam, we speak of a "free weir." The flow over the weir is then dependent upon the higher water level and not on the difference between high and low water levels. When the weir is "submerged", that is, the higher water level is less than 2/3 times the difference between the lower water and the crest of the dam, the difference between the high and low levels being decisive. The free weir normally occurs first during ebb, and is due to. the fact that mean level in the estuary is higher than the mean level of . the tide in building dams with barges the maximum velocity in the closing gap may not be more than 3m/sec. As the maximum velocities are higher than this limit we must use other construction methods in closing the gap. This can be done by dump-cars from each side or by using a cable way.e or by using a cable way.

  • PDF

축제용흙의 함수비 변화에 의한 다짐율 및 수용계수 변화에 관한 연구 (A study of compaction ratio and permeability of soil with different water content)

  • 윤충섭
    • 한국농공학회지
    • /
    • 제13권4호
    • /
    • pp.2456-2470
    • /
    • 1971
  • 수수자원(水水資源) 개발(開發)을 위(爲)한 Earth Dam이나 도로(道路)와 같은 흙을 주(主)로하는 많은 구조물축조(構造物築造)에 있어서 그 구조물성질(構造物性質)에 따라서 흙의 종류(種類)가 결정(決定)되며 때로는 흙의 성질(性質)에 따라서 구조물(構造物)의 설계(設計)가 달라진다. 특(特)히 저수(貯水)를 목적(目的)으로 하는 제당축조(堤塘築造)에서 중심점토재료(中心粘土材料)의 선정(選定)은 완전(完全)한 구조물(構造物)을 위(爲)해서 또 공사비(工事費) 절감(節減)을 위(爲)해서 대단(大端)히 중요(重要)한 문제(問題)라 하겠다. 이를 위해서 여러종류(種類)의 흙이 사용(使用)되고 있고 이들 흙의 제반(諸般) 역학적(力學的) 성질(性質)이 이미 실시(實施)된 많은 시험결과(試驗結果)로서 실제(實際) 설계(設計)에, 또 구조물(構造物) 안전도(安全度) 검토(檢討)에 응용(應用)되고 있으나 이들 결과(結果)는 그 흙의 최적함수비(最適含水比) 최대밀도(最大密度)에 대(對)한 것으로 실제(實際) 시공과정(施工過程)에서 볼 때 최과함수상태하(最過含水狀態下)에서 시공(施工)하기는 어려운 것으로 이런 경우(境遇)에 흙의 역학적성질(力學的性質)에 대(對)한 자료(資料)가 없어 설계(設計) 및 안전도(安全度) 검토(檢討)에 지장(支障)이 많은바 이를 위해서 본(本) 시험(試驗)을 실시(實施)하였다. 1. 시험(試驗)에 사용(使用)한 시료(試料)는 실제(實際) 저수지(貯水池) 축제재료(築提材料)로서 사용(使用)하고 있는 재료(材料)를 현장(現場)에서 채취(採取)하였다. 2. 본(本) 시험(試驗)은 농업진흥공사(農業振興公社) 농공시험소(農工試驗所)에서 실시(實施)하였다. 3. 본(本) 시험(試驗) 결과(結果)로서 다음과 같은 점(點)을 실제업무(實際業務)에 응용(應用)할 수 있다. 가. 현장함수비(現場含水比)를 알므로서 공사재료(工事材料)로서의 적부판단(適否判斷)을 내릴수 있다. 나. 함수비(含水比)가 변화시(變化時) 다짐율(率)과 투수계수(透水係數)를 알 수 있으므로 실제설계(實際設計) 및 시공관리(施工管理)에 적용(適用)할수 있다. 다. 시공(施工)된 구조물(構造物)의 다짐율(率)을 알므로서 이에 적합(適合)한 안정도검토(安定度檢討)를 할수 있다. 라. 도로(道路)와 같은 높은 지내력(支耐力)을 요(要)하는 구조물(構造物)을 위(爲)해서는 최적함수비(最適含水比) 내지 건조상태(乾燥狀態)가 좋고 저수지(貯水池)와 같은 지수(止水)를 요(要)하는 구조물(構造物)에서는 최적함수비(最適含水比) 내지 습윤상태(濕潤狀態)로 시공(施工)함이 좋다. 그러나 고소성(高塑性) 흙에서는 지내력(支耐力) 및 지수(止水)를 위해서 공(共)히 후자(後者)의 경우(境遇)가 좋다. 이상(以上)의 연구결과(硏究結果)가 완벽(完璧)하다고는 할수 없으나 본(本) 실험(實驗) 결과(結果)로서 함수비(含水比) 변화(變化)에 대(對)한 제반(諸般) 역학적(力學的) 성질(性質)의 변화상태(變化狀態)를 구(求)하기에 최선(最善)을 하였으므로 이 분야(分野)의 연구자(硏究者)나 설계자(設計者) 또는 시공자(施工者)와 같은 실무자(實務者)에게 다소(多少)의 도움이 된다면 큰영광(榮光)으로 생각 하겠다.

  • PDF

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

프로세스 마이닝을 이용한 공공서비스의 품질 측정: N시의 건축 인허가 민원 서비스를 중심으로 (Measuring the Public Service Quality Using Process Mining: Focusing on N City's Building Licensing Complaint Service)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.35-52
    • /
    • 2019
  • 전자정부를 포함한 다양한 형태의 공공서비스가 제공됨에 따라 공공서비스 품질에 대한 국민의 요구 수준이 점점 높아지고 있다. 공공서비스의 품질을 높이기 위해서 공공서비스 품질에 대한 상시적 측정과 개선이 필요함에도 불구하고 전통적인 설문조사는 비용과 시간이 많이 소요되어 한계가 있다. 따라서 공공서비스에서 발생하는 데이터를 기반으로 원하는 시점에 언제라도 공공서비스의 품질을 빠르고 정확하게 측정할 수 있는 분석적 기법이 필요하다. 본 연구에서 공공서비스의 품질을 데이터 기반으로 분석하기 위해 N시의 건축 인허가 민원 서비스를 대상으로 프로세스 마이닝 기법을 이용하여 분석하였다. N시의 건축 인허가 민원 서비스는 분석에 필요한 데이터를 확보할 수 있고 공공서비스 품질관리를 통해 타 기관으로 확산 가능할 것으로 판단되었기 때문이다. 본 연구는 2014년 1월부터 2년 동안 N시에서 발생한 총 3678건의 건축 인허가 민원 서비스에 대해 프로세스 마이닝을 실시하여 프로세스 맵을 그리고 빈도가 높은 부서와 평균작업시간이 긴 부서를 파악하였다. 분석 결과에 따르면 특정 시점에 한 부서별로 업무가 몰리거나 상대적으로 업무가 적은 경우가 발생하였다. 또한 민원의 부하가 늘 경우 민원완료까지 걸리는 시간이 늘어날 것이라는 합리적인 의심을 하였으나 분석 결과 상관관계는 크게 없었다. 분석 결과에 따르면 민원완료까지 걸리는 시간은 당일처리에서 1년 146일까지 매우 다양하게 분포하였다. '하수처리과,' '수도과,' '도시디자인과,' '녹색성장과'의 상위 4개 부서의 누적빈도가 전체의 50%를 넘고 상위 9개 부서의 누적빈도가 70%를 넘어서는 등 빈도가 높은 부서는 한정적이며 부서 간 부하의 불균형이 심했다. 대부분의 민원 서비스는 서로 다른 다양한 패턴의 프로세스를 갖고 있었다. 본 연구의 결과를 활용하면 특정 시점에 민원의 부하가 큰 부서를 찾아내 부서 간 인력 배치를 탄력적으로 운영할 수 있을 것이다. 또한 민원 특성별 협의에 참여하는 부서의 패턴을 분석한 결과, 협의 부서 요청 시 자동화 혹은 추천에 활용할 수 있는 가능성이 보인다. 본 연구는 민원 서비스에 대한 프로세스 마이닝 분석을 통해 향후 공공서비스 품질 개선방향을 제시하는데 활용될 것으로 기대한다.

전문성 이식을 통한 딥러닝 기반 전문 이미지 해석 방법론 (Deep Learning-based Professional Image Interpretation Using Expertise Transplant)

  • 김태진;김남규
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.79-104
    • /
    • 2020
  • 최근 텍스트와 이미지 딥러닝 기술의 괄목할만한 발전에 힘입어, 두 분야의 접점에 해당하는 이미지 캡셔닝에 대한 관심이 급증하고 있다. 이미지 캡셔닝은 주어진 이미지에 대한 캡션을 자동으로 생성하는 기술로, 이미지 이해와 텍스트 생성을 동시에 다룬다. 다양한 활용 가능성 덕분에 인공지능의 핵심 연구 분야 중 하나로 자리매김하고 있으며, 성능을 다양한 측면에서 향상시키고자 하는 시도가 꾸준히 이루어지고 있다. 하지만 이처럼 이미지 캡셔닝의 성능을 고도화하기 위한 최근의 많은 노력에도 불구하고, 이미지를 일반인이 아닌 분야별 전문가의 시각에서 해석하기 위한 연구는 찾아보기 어렵다. 동일한 이미지에 대해서도 이미지를 접한 사람의 전문 분야에 따라 관심을 갖고 주목하는 부분이 상이할 뿐 아니라, 전문성의 수준에 따라 이를 해석하고 표현하는 방식도 다르다. 이에 본 연구에서는 전문가의 전문성을 활용하여 이미지에 대해 해당 분야에 특화된 캡션을 생성하기 위한 방안을 제안한다. 구체적으로 제안 방법론은 방대한 양의 일반 데이터에 대해 사전 학습을 수행한 후, 소량의 전문 데이터에 대한 전이 학습을 통해 해당 분야의 전문성을 이식한다. 또한 본 연구에서는 이 과정에서 발생하게 되는 관찰간 간섭 문제를 해결하기 위해 '특성 독립 전이 학습' 방안을 제안한다. 제안 방법론의 실현 가능성을 파악하기 위해 MSCOCO의 이미지-캡션 데이터 셋을 활용하여 사전 학습을 수행하고, 미술 치료사의 자문을 토대로 생성한 '이미지-전문 캡션' 데이터를 활용하여 전문성을 이식하는 실험을 수행하였다. 실험 결과 일반 데이터에 대한 학습을 통해 생성된 캡션은 전문적 해석과 무관한 내용을 다수 포함하는 것과 달리, 제안 방법론에 따라 생성된 캡션은 이식된 전문성 관점에서의 캡션을 생성함을 확인하였다. 본 연구는 전문 이미지 해석이라는 새로운 연구 목표를 제안하였고, 이를 위해 전이 학습의 새로운 활용 방안과 특정 도메인에 특화된 캡션을 생성하는 방법을 제시하였다.