wsz
2025-06-10 70eedd3bf9810bc022967da6446dd8a0ff6f43b7
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
-- Copyright 2015-2018 David B. Lamkins <david@lamkins.net>. See License.txt.
-- man/roff LPeg lexer.
 
local lexer = require('lexer')
local token, word_match = lexer.token, lexer.word_match
local P, R, S = lpeg.P, lpeg.R, lpeg.S
 
local lex = lexer.new('man')
 
-- Whitespace.
lex:add_rule('whitespace', token(lexer.WHITESPACE, lexer.space^1))
 
-- Markup.
lex:add_rule('rule1', token(lexer.STRING, '.' * ('B' * P('R')^-1 +
                                                 'I' * P('PR')^-1) *
                                          lexer.nonnewline^0))
lex:add_rule('rule2', token(lexer.NUMBER, '.' * S('ST') * 'H' *
                                          lexer.nonnewline^0))
lex:add_rule('rule3', token(lexer.KEYWORD, P('.br') + '.DS' + '.RS' + '.RE' +
                                           '.PD'))
lex:add_rule('rule4', token(lexer.LABEL, '.' * (S('ST') * 'H' + '.TP')))
lex:add_rule('rule5', token(lexer.VARIABLE, '.B' * P('R')^-1 +
                                            '.I' * S('PR')^-1 +
                                            '.PP'))
lex:add_rule('rule6', token(lexer.TYPE, '\\f' * S('BIPR')))
lex:add_rule('rule7', token(lexer.PREPROCESSOR, lexer.starts_line('.') *
                                                lexer.alpha^1))
 
return lex