AIL-framework/bin/lib/objects/Titles.py

#!/usr/bin/env python3
# -*-coding:UTF-8 -*

import os
import sys

from hashlib import sha256
from flask import url_for

# import warnings
# warnings.filterwarnings("ignore", category=DeprecationWarning)
from pymisp import MISPObject

sys.path.append(os.environ['AIL_BIN'])
##################################
# Import Project packages
##################################
from lib.ConfigLoader import ConfigLoader
from lib.objects.abstract_daterange_object import AbstractDaterangeObject, AbstractDaterangeObjects

config_loader = ConfigLoader()
r_objects = config_loader.get_db_conn("Kvrocks_Objects")
baseurl = config_loader.get_config_str("Notifications", "ail_domain")
config_loader = None


class Title(AbstractDaterangeObject):
    """
    AIL Title Object.
    """

    def __init__(self, id):
        super(Title, self).__init__('title', id)

    # def get_ail_2_ail_payload(self):
    #     payload = {'raw': self.get_gzip_content(b64=True),
    #                 'compress': 'gzip'}
    #     return payload

    # # WARNING: UNCLEAN DELETE /!\ TEST ONLY /!\
    def delete(self):
        # # TODO:
        pass

    def get_content(self, r_type='str'):
        if r_type == 'str':
            return self._get_field('content')
        elif r_type == 'bytes':
            return self._get_field('content').encode()

    def get_link(self, flask_context=False):
        if flask_context:
            url = url_for('correlation.show_correlation', type=self.type, id=self.id)
        else:
            url = f'{baseurl}/correlation/show?type={self.type}&id={self.id}'
        return url

    def get_svg_icon(self):
        return {'style': 'fas', 'icon': '\uf1dc', 'color': '#3C7CFF', 'radius': 5}

    def get_misp_object(self):
        obj_attrs = []
        obj = MISPObject('tsk-web-history')
        first_seen = self.get_first_seen()
        last_seen = self.get_last_seen()
        if first_seen:
            obj.first_seen = first_seen
        if last_seen:
            obj.last_seen = last_seen
        if not first_seen or not last_seen:
            self.logger.warning(
                f'Export error, None seen {self.type}:{self.subtype}:{self.id}, first={first_seen}, last={last_seen}')

        obj_attrs.append(obj.add_attribute('title', value=self.get_content()))
        for obj_attr in obj_attrs:
            for tag in self.get_tags():
                obj_attr.add_tag(tag)
        return obj

    def get_meta(self, options=set()):
        meta = self._get_meta(options=options)
        meta['id'] = self.id
        meta['tags'] = self.get_tags(r_list=True)
        meta['content'] = self.get_content()
        return meta

    def create(self, content, _first_seen=None, _last_seen=None):
        self._set_field('content', content)
        self._create()


def create_title(content):
    title_id = sha256(content.encode()).hexdigest()
    title = Title(title_id)
    if not title.exists():
        title.create(content)
    return title


class Titles(AbstractDaterangeObjects):
    """
        Titles Objects
    """
    def __init__(self):
        super().__init__('title', Title)

    def sanitize_id_to_search(self, name_to_search):
        return name_to_search


# if __name__ == '__main__':
#     # from lib import crawlers
#     # from lib.objects import Items
#     # for item in Items.get_all_items_objects(filters={'sources': ['crawled']}):
#     #     title_content = crawlers.extract_title_from_html(item.get_content())
#     #     if title_content:
#     #         print(item.id, title_content)
#     #         title = create_title(title_content)
#     #         title.add(item.get_date(), item.id)
#     titles = Titles()
#     # for r in titles.get_ids_iterator():
#     #     print(r)
#     r = titles.search_by_id('f7d57B', r_pos=True, case_sensitive=False)
#     print(r)
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00			`#!/usr/bin/env python3`
			`# --coding:UTF-8 -`

			`import os`
			`import sys`

			`from hashlib import sha256`
			`from flask import url_for`

chg: [titles] add title IDs and contents search 2023-06-13 15:29:11 +02:00			`# import warnings`
			`# warnings.filterwarnings("ignore", category=DeprecationWarning)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00			`from pymisp import MISPObject`

			`sys.path.append(os.environ['AIL_BIN'])`
			`##################################`
			`# Import Project packages`
			`##################################`
			`from lib.ConfigLoader import ConfigLoader`
			`from lib.objects.abstract_daterange_object import AbstractDaterangeObject, AbstractDaterangeObjects`

			`config_loader = ConfigLoader()`
			`r_objects = config_loader.get_db_conn("Kvrocks_Objects")`
			`baseurl = config_loader.get_config_str("Notifications", "ail_domain")`
			`config_loader = None`


			`class Title(AbstractDaterangeObject):`
			`"""`
			`AIL Title Object.`
			`"""`

			`def __init__(self, id):`
			`super(Title, self).__init__('title', id)`

			`# def get_ail_2_ail_payload(self):`
			`# payload = {'raw': self.get_gzip_content(b64=True),`
			`# 'compress': 'gzip'}`
			`# return payload`

			`# # WARNING: UNCLEAN DELETE /!\ TEST ONLY /!\`
			`def delete(self):`
			`# # TODO:`
			`pass`

			`def get_content(self, r_type='str'):`
			`if r_type == 'str':`
			`return self._get_field('content')`
chg: [titles] add yara tracker on title + tags domains if unsafe title tags 2023-08-23 11:16:22 +02:00			`elif r_type == 'bytes':`
			`return self._get_field('content').encode()`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00
			`def get_link(self, flask_context=False):`
			`if flask_context:`
			`url = url_for('correlation.show_correlation', type=self.type, id=self.id)`
			`else:`
			`url = f'{baseurl}/correlation/show?type={self.type}&id={self.id}'`
			`return url`

			`def get_svg_icon(self):`
chg: [correlation graph] update node legend 2023-05-26 11:44:29 +02:00			`return {'style': 'fas', 'icon': '\uf1dc', 'color': '#3C7CFF', 'radius': 5}`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00
			`def get_misp_object(self):`
			`obj_attrs = []`
			`obj = MISPObject('tsk-web-history')`
fix: [MISP export] fix ail object first/last seen + obj logger 2023-06-09 11:19:22 +02:00			`first_seen = self.get_first_seen()`
			`last_seen = self.get_last_seen()`
			`if first_seen:`
			`obj.first_seen = first_seen`
			`if last_seen:`
			`obj.last_seen = last_seen`
			`if not first_seen or not last_seen:`
			`self.logger.warning(`
			`f'Export error, None seen {self.type}:{self.subtype}:{self.id}, first={first_seen}, last={last_seen}')`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00
			`obj_attrs.append(obj.add_attribute('title', value=self.get_content()))`
			`for obj_attr in obj_attrs:`
			`for tag in self.get_tags():`
			`obj_attr.add_tag(tag)`
			`return obj`

			`def get_meta(self, options=set()):`
			`meta = self._get_meta(options=options)`
			`meta['id'] = self.id`
			`meta['tags'] = self.get_tags(r_list=True)`
			`meta['content'] = self.get_content()`
			`return meta`

			`def create(self, content, _first_seen=None, _last_seen=None):`
			`self._set_field('content', content)`
			`self._create()`


			`def create_title(content):`
			`title_id = sha256(content.encode()).hexdigest()`
			`title = Title(title_id)`
			`if not title.exists():`
			`title.create(content)`
			`return title`

chg: [module] add CEDetector 2024-10-11 14:36:02 +02:00
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00			`class Titles(AbstractDaterangeObjects):`
			`"""`
			`Titles Objects`
			`"""`
			`def __init__(self):`
chg: [titles] add title IDs and contents search 2023-06-13 15:29:11 +02:00			`super().__init__('title', Title)`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00
chg: [titles] add title IDs and contents search 2023-06-13 15:29:11 +02:00			`def sanitize_id_to_search(self, name_to_search):`
chg: [new title object] add new title object + correlation on page title 2023-05-25 14:33:12 +02:00			`return name_to_search`


			`# if __name__ == '__main__':`
chg: [titles] add title IDs and contents search 2023-06-13 15:29:11 +02:00			`# # from lib import crawlers`
			`# # from lib.objects import Items`
			`# # for item in Items.get_all_items_objects(filters={'sources': ['crawled']}):`
			`# # title_content = crawlers.extract_title_from_html(item.get_content())`
			`# # if title_content:`
			`# # print(item.id, title_content)`
			`# # title = create_title(title_content)`
			`# # title.add(item.get_date(), item.id)`
			`# titles = Titles()`
			`# # for r in titles.get_ids_iterator():`
			`# # print(r)`
			`# r = titles.search_by_id('f7d57B', r_pos=True, case_sensitive=False)`
			`# print(r)`