[자바스트립트] 특정문구와 붙어있는 텍스트만 추출하고 싶을때
const text = "_220810004_PO 1.6T_24 _220810004_PO 1.6T_24.geo CAS_6017_60SET_02_01 130 9 _220810004_PO 1.6T_25 _220810004_PO 1.6T_25.geo CAS_6017_60SET_02_01 240 10 _220810004_PO 1.6T_23 _220810004_PO 1.6T_23.geo CAS_6017_60SET_02_06, CAS_6017_60SET_02_07, CAS_6017_60SET_02_11 60 / : : : G E O : : : I D : : : _220810004_PO 1.6T_26 _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ K M S 6 0 1 7 _ 7 - 1 E A _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ 2 6 . g e o 7 0 9 . 9 0 x 4 2 9 . 0 0 m m O R 3 0 5 3 : : : : : : : : 60 3.54 kg 00:00:16 0.27 0.281623 m2 2600.41 mm 3 : : : G E O : : : I D : : : _220810004_PO 1.6T_28 _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ K M S 6 0 1 7 _ 9 - 1 E A _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ 2 8 . g e o 4 0 0 . 0 0 x 2 3 9 . 6 0 m m O R 3 0 5 5 : : : : : : : ";
위의 어질어질한 테스트 중... (위의 텍스트는 pdf파일의 text를 일부 추출한 내용임)
.geo파일만 추출하고 싶다면?
이런 경우는 많이 있을 것입니다. pdf파일의 image만 추출하는 방법을 연구중인데, 일단 텍스트의 geo파일 리스트를 만들고 싶어서 시도해봤습니다.
자바스크립트 코드는 아래와 같습니다.
const regex = /[\w-]+\.geo/g;
const names = text.match(regex);
console.log(names);
// 출력 결과
"_220810004_PO 1.6T_24.geo", "_220810004_PO 1.6T_25.geo", "_220810004_PO 1.6T_26.geo", "_220810004_PO 1.6T_28.geo"
const text = "_220810004_PO 1.6T_24 _220810004_PO 1.6T_24.geo CAS_6017_60SET_02_01 130 9 _220810004_PO 1.6T_25 _220810004_PO 1.6T_25.geo CAS_6017_60SET_02_01 240 10 _220810004_PO 1.6T_23 _220810004_PO 1.6T_23.geo CAS_6017_60SET_02_06, CAS_6017_60SET_02_07, CAS_6017_60SET_02_11 60 / : : : G E O : : : I D : : : _220810004_PO 1.6T_26 _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ K M S 6 0 1 7 _ 7 - 1 E A _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ 2 6 . g e o 7 0 9 . 9 0 x 4 2 9 . 0 0 m m O R 3 0 5 3 : : : : : : : : 60 3.54 kg 00:00:16 0.27 0.281623 m2 2600.41 mm 3 : : : G E O : : : I D : : : _220810004_PO 1.6T_28 _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ K M S 6 0 1 7 _ 9 - 1 E A _ 2 2 0 8 1 0 0 0 4 _ P O 1 . 6 T _ 2 8 . g e o 4 0 0 . 0 0 x 2 3 9 . 6 0 m m O R 3 0 5 5 : : : : : : : ";
const regex = /[\w-]+\.geo/g;
const names = text.match(regex);
console.log(names); // 출력 결과: ["_220810004_PO 1.6T_24.geo", "_220810004_PO 1.6T_25.geo", "_220810004_PO 1.6T_26.geo", "_220810004_PO 1.6T_28.geo"]