1.EPL语法简介
EPL全称Event Processing Language,是一种类似SQL的语言,包含了SELECT, FROM, WHERE, GROUP BY, HAVING 和 ORDER BY子句,同时用事件流代替了table作为数据源,并且能像SQL那样join,filtering和aggregation。除了select,EPL也有insert into,update,delete,不过含义和SQL并不是很接近。另外还有pattern和output子句,这两个是SQL所没有的。EPL还定义了一个叫view的东西,类似SQL的table,来决定哪些数据是可用的,Esper提供了十多个view,并且保证这些view可以被重复使用。而且用户还可以扩展view成为自定义view来满足需求。在view的基础上,EPL还提供了named window的定义,作用和view类似,但是更加灵活。
2.语法
大部分EPL语句都遵循以下格式
[annotations][expression_declarations][context context_name][insert into insert_into_def]select select_listfrom stream_def [as name] [, stream_def [as name]] [,...][where search_conditions][group by grouping_expression_list][having grouping_search_conditions][output output_specification][order by order_by_expression_list][limit num_rows]
3.时间周期
time-period : [year-part] [month-part] [week-part] [day-part] [hour-part] [minute-part] [seconds-part] [milliseconds-part]year-part : (number|variable_name) ("years" | "year")month-part : (number|variable_name) ("months" | "month")week-part : (number|variable_name) ("weeks" | "week")day-part : (number|variable_name) ("days" | "day")hour-part : (number|variable_name) ("hours" | "hour")minute-part : (number|variable_name) ("minutes" | "minute" | "min")seconds-part : (number|variable_name) ("seconds" | "second" | "sec")milliseconds-part : (number|variable_name) ("milliseconds" | "millisecond" | "msec")
时间范围在EPL中的使用:
select avg(price) from Fruit.win:time(5 minute 3 sec) //在5分3秒中统计price平均值。select sum(account) from User output every 1 day //每天输出一次计算结果
Esper规定每月的天数都是30天,所以对准确性要求高的业务,以月为单位进行计算会出现误差的。
4.注解
EPL也可以写注解,种类不多,大部分简单而有效
// 不包含参数或者单个参数的注解@annotation_name [(annotation_parameters)] // 包含多个属性名-值对的注解@annotation_name (attribute_name = attribute_value, [name=value, ...]) // 多个注解联合使用@annotation_name [(annotation_parameters)] [@annotation_name [(annotation_parameters)]] [...]
具体注解
1) 指定EPL的名称,参数只有一个。例如:@Name("MyEPL")
2)@Description 对EPL进行描述,参数只有一个。例如:@Description("This is MyEPL")
3) 对EPL进行额外的说明,参数有两个分别为Tag的名称和Tag的值,用逗号分隔。例如:@Tag(name="author",value="luonanqin")
4)@Priority 指定EPL的优先级,参数只有一个,并且整数(可负可正)。例如:@Priority(10)
5)@Drop 指定事件经过此EPL后不再参与其他的EPL计算,该注解无参数
6)@Hint 为EPL加上某些标记,让引擎对此EPL产生其他的操作,会改变EPL实例的内存占用,但通常不会改变输出。其参数固定,由Esper提供
7)@Audit EPL添加此注解后,可以额外输出EPL运行情况,有点类似日志的感觉(当然没有日志的功能全啦),具体使用场景在此先不提。
8)@Hook 与SQL相关,这里暂且不说
9)@EventRepresentation 这是用来指定EPL产生的计算结果事件包含的数据形式。参数只有一个,即array=true或array=false。false为默认值,代表数据形式为Map,若为true,则数据形式为数组。
5.表达式
类似自定义函数,通常用Lambda表达式来建立的(也有别的方法建立),而Lambda表达式就一个“ => ”符号,表示“gose to”。符号的左边表示输入参数,符号右边表示计算过程,计算结果就是这个表达式的返回值,即Expression的返回值。
语法:
expression expression_name { expression_body }
expression是关键字,expression_name为expression的名称(唯一),expression_body是expression的具体内容。
expression_body语法格式:
expression_body: (input_param [,input_param [,...]]) => expression
例如:
expression middle { x => (x.max+x.min)/2 } select middle(apple) from Apple as apple
x表示输入参数,而x.max和x.min都是x代表的事件流的属性,如果事件流没这个属性,expression的定义就是错误的。
express的定义必须在使用它的句子之前完成。使用时直接写expression的名字和用圆括号包含要计算的参数即可。再次提醒,expression的参数只能是事件流别名,即apple,别名的定义就如上面那样,事件流之后跟着as,然后再跟别名。
多个expression情况
expression sumage { (x,y) => x.age+y.age } select sumage(me,you) from Me as me, You as you
全局表达式
对于expression里用另一个expression,EPL不允许在一个句子里建立两个expression,所以就出现了Global-Expression。普通的expression只作用于定义它的epl,如上面所有的包含select子句的epl就是如此。
create expression expression_name { expression_body }
和普通的expression相比,就是多了个create,不过他不能和别的子句放在一起,即他是单独执行的。
epService.getEPAdministrator().createEPL("create expression avgPrice { x => (x.fist+x.last)/2 }");
在expression使用全局expression
// 先定义全局的avgPricecreate expression avgPrice { x => (x.fist+x.last)/2 } // bananaPrice Banana事件中包含了first和last属性,否则将报错expression bananaPrice{ x => avgPrice(x) } select bananaPrice(b) from Banana as b
转载:https://blog.csdn.net/luonanqin/article/details/11539221