awk 사용하기 정보
JavaScript awk 사용하기
본문
1) awk란?
* awk의 개념
- 프로그래밍 언어/패턴의 검색과 조작.
- 파일의 각 라인에서 필드(field)를 인식할 수 있는 패턴 매칭 기능
* awk의 응용분야.
- 데이터 프로세싱, 리포트 작성, 간단한 데이터 베이스 구축 등...
* awk를 이용한 작업.
- 프로그램의 입력 파일이 특정한 형식에 맞게 이루어져 있는지 검사.
- 출력화일을 처리하여 리포트를 만들어 냄.
- 다른 프로그램의 입력 형식에 맞게 변환하는 작업에 이용.
* c언어와 같은 연산자를 사용할 수 있다
---> +=, *=, %= 등등
2) awk 프로그램의 구조 및 실행.
* awk의 구조.
- awk [option] [files]
- awk -f pattern-action-file 파일이름.
*awk의 pattern. 패 턴
BEGIN
입력화일을 읽어들이기 전에 옆에 제시되는 문자를 실행.
---> BEGIN {print "kuja의 프로그램“} {print}
“kuja의 프로그램“을 먼저 찍고 다음이 계속 찍힘
END
awk가 모든 입력을 처리한 후, 옆에 제시되는 문장을 실행.
---> END {print "kuja의 프로그램“} {print}
내용을 먼저 찍고 “kuja의 프로그램“이 찍힘
-f fileName : awk 프로그램을 파일로 만들었을 때 이를 지정함.
----> kjh.awk를 만들었을경우는 awk -f kjh.awk (파일명)
{fileName}* : 지정된 파일에서 받아들임.
-$1 (첫 번째 항목), $2 (두 번째 항목).....
-$0 (줄 전체)
** awk '/kuja/' * = grep "kuja" *
--> 모든 화일에서 kuja라는 단어가 있는 줄을 찾아 그 줄을 출력해 줍니다.
kjh(텍스트파일) -> 이름,주소,취미,나이 4개의 필드
** awk를 이용하여 '구자현'이라는 이름을 가진 사람을 찾는다.
----> $ awk '/구자현/' kjh
** friend 텍스트 파일 중 영역 세번째 와 첫번째를 출력한다.
----> (.. awk '{print $3,$1}' kjh
1. '구'단어를 이용하여 구씨 성을 가진 사람을 찾는다.
(.. $ awk '/구/' kjh
2. 나이가 27살인 사람을 찾는다.
(.. $ awk '$4 -- 27' kjh
3. 나이가 27살보다 작은 모든 사람을 출력한다.
(.. $ awk '$4 < 27' kjh
4. kjh파일에서나이가 27살 보다 적고 성이 구씨인 사람을 출력한다.
(.. $ awk '$4 < 27 && /구/' kjh
% ls -al kuja.pc | awk '{print $2, $7}'
kuja.pc의 2번째 필드와 7번째 필드를 보여줌
다. 그러나 sed에서 사용하는 것과는 차이가 남을 명심하라.(sed는 앞의 검색문이 실패할 경우만 뒤의 명령을 수행한다.)
awk는 두가지 특수한 패턴을 제공한다. BEGIN과 END가 바로 그것이다. BEGIN은 첫번째 행이 읽어들이기 전에 수행되는 행위를 지정하는 것이고, END는 마지막 행이 읽어들이고 나서 수행되는 행위를 지정하는 것이다. 예를 들어서 awk에서 필드를 나누는 문자를 행을 읽기전에 미리 정의한다고 생각해보자.
% awk 'BEGIN { FS = ":" } $2 == ""' /etc/passwd
awk에서 FS는 필드를 나누는 문자를 의미한다. END에 대한 예는 아래 '쓸만한 예제 하나'편에 나와있으므로 참조하기 바란다.
$ vi kuja
10 20 30 40 50
----> 5개의 필드 10, 20, 30, 40, 50이 있는 kuja라는 파일을 만든다
$ awk '{ s = $1 + $2 + $3 + $4 + $5 } END { print s }' kuja
---> 150
* NR --> 줄을 입력 , NF --> 필드를 입력
** for문
$ vi ku
10 20 30 40 50
$ vi ku.awk
> '{ for ( i = 1; i <= NF; i++ )
> sum += $i }
> END { print sum }' data
--> 필드값의 합인 150이 출력됨
** while문
$ vi ku1.awk
> '{ i = 1
> while ( i <= NF ) {
> s += $i
> i++
> }
> }
> END { print s }' data
---> 마찬가지로 150이 출력
** for : for(초기화; 조건검사; 명령) { 명령어들 }
** while : while(조건검사) {명령어들}
** if : if(조건검사) {명령어들}
[ else {명령어들} ]
** break : for, while의 loop문 안에서 빠져나가기.
** continue : continue문장 뒤에 오는 명령어들은 생략하고 다시 조건검사로
돌아갑니다.
** 변수사용시에는 "$변수명"로 사용함
** 패턴 사용법 : "/패턴/,/패턴/"
/^kuja/ : ^(맨처음) --> kuja로 시작되는 줄
/kuja$/ : $(맨끝) --> kuja러 끝나는 줄
/^$/ : 공백줄
/.bbc/ : .(정해지지 않은 한문자)
0