Edit File: parser.cpython-311.opt-1.pyc
� �����f�B����������������������������d�Z�ddlZddlZddlmZ�dgZ�ej��������d������������Z�ej��������d������������Z�ej��������d������������Z �ej��������d������������Z �ej��������d ������������Z�ej��������d ������������Z�ej��������d������������Z �ej��������d������������Z�ej��������d ������������Z�ej��������dej��������������������Z�ej��������d ������������Z�ej��������d������������Z�G�d��dej��������������������ZdS�)zA parser for HTML and XHTML.�����N)�unescape� HTMLParserz[&<]z &[a-zA-Z#]z%&([a-zA-Z][-.a-zA-Z0-9]*)[^a-zA-Z0-9]z)&#(?:[0-9]+|[xX][0-9a-fA-F]+)[^0-9a-fA-F]z <[a-zA-Z]�>z--\s*>z+([a-zA-Z][^\t\n\r\f />\x00]*)(?:\s|/(?!>))*z]((?<=[\'"\s/])[^\s/>][^\s/=>]*)(\s*=+\s*(\'[^\']*\'|"[^"]*"|(?![\'"])[^>\s]*))?(?:\s|/(?!>))*aF�� <[a-zA-Z][^\t\n\r\f />\x00]* # tag name (?:[\s/]* # optional whitespace before attribute name (?:(?<=['"\s/])[^\s/>][^\s/=>]* # attribute name (?:\s*=+\s* # value indicator (?:'[^']*' # LITA-enclosed value |"[^"]*" # LIT-enclosed value |(?!['"])[^>\s]* # bare value ) \s* # possibly followed by a space )?(?:\s|/(?!>))* )* )? \s* # trailing whitespace z#</\s*([a-zA-Z][-.a-zA-Z0-9:_]*)\s*>c�������������������������e�Zd�ZdZdZdd�d�Zd��Zd��Zd��Zd Z d ��Z d��Zd��Zd ��Z d��Zdd�Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd��Zd S�) r���aE��Find tags and other markup and call handler functions. Usage: p = HTMLParser() p.feed(data) ... p.close() Start tags are handled by calling self.handle_starttag() or self.handle_startendtag(); end tags by self.handle_endtag(). The data between tags is passed from the parser to the derived class by calling self.handle_data() with the data as argument (the data may be split up in arbitrary chunks). If convert_charrefs is True the character references are converted automatically to the corresponding Unicode character (and self.handle_data() is no longer split in chunks), otherwise they are passed by calling self.handle_entityref() or self.handle_charref() with the string containing respectively the named or numeric reference as the argument. )�script�styleT)�convert_charrefsc�����������������<�����||�_���������|�������������������������������������dS�)z�Initialize and reset this instance. If convert_charrefs is True (the default), all character references are automatically converted to the corresponding Unicode characters. N)r ����reset)�selfr ���s��� �2/opt/alt/python311/lib64/python3.11/html/parser.py�__init__zHTMLParser.__init__V���s�������!1���� � ����������c�����������������������d|�_���������d|�_��������t����������|�_��������d|�_��������t ����������j�����������������������������|��������������dS�)z1Reset this instance. Loses all unprocessed data.��z???N)�rawdata�lasttag�interesting_normal�interesting� cdata_elem�_markupbase� ParserBaser����r���s��� r ���r���zHTMLParser.reset_���s<������������-��������$�$�T�*�*�*�*�*r���c������������������N�����|�j���������|z���|�_���������|����������������������d�������������dS�)z�Feed data to the parser. Call this as often as you want, with as little or as much text as you want (may include '\n'). r���N)r����goahead�r����datas��� r ����feedzHTMLParser.feedg���s%��������|�d�*������Q�����r���c������������������0�����|�����������������������d�������������dS�)zHandle any buffered data.����N)r���r���s��� r ����closezHTMLParser.closep���s���������Q�����r���Nc�����������������������|�j���������S�)z)Return full source of start tag: '<...>'.)�_HTMLParser__starttag_textr���s��� r ����get_starttag_textzHTMLParser.get_starttag_textv���s�������#�#r���c�����������������������|������������������������������������|�_��������t����������j��������d|�j��������z��t����������j��������������������|�_��������d�S�)Nz</\s*%s\s*>)�lowerr����re�compile�Ir���)r����elems��� r ����set_cdata_modezHTMLParser.set_cdata_modez���s4�������*�*�,�,����:�n�t��&F���M�M����r���c������������������,�����t�����������|�_��������d�|�_��������d�S��N)r���r���r���r���s��� r ����clear_cdata_modezHTMLParser.clear_cdata_mode~���s������-�������r���c����������������������|�j���������}d}t����������|������������}||k������r|�j��������r}|�j��������sv|���������������������d|������������}|dk�����rY|���������������������dt ����������||dz ��������������������������}|dk����r*t����������j��������d������������� ��������������������||������������s�n�|}n=|�j ��������� ��������������������||������������}|r|�����������������������������������}n|�j��������r�nZ|}||k�����rV|�j��������r2|�j��������s+|����������������������t����������|||�����������������������������������n|����������������������|||�����������������������|����������������������||������������}||k����r�n�|j��������}�|d|�������������r�t �������������������������������||������������r|����������������������|������������} n��|d|������������r|����������������������|������������} n��|d|������������r|����������������������|������������} nj�|d|������������r|����������������������|������������} nH�|d |������������r|����������������������|������������} n&|d z���|k�����r|����������������������d�������������|d z���} n�n�| dk�����r�|s�n�|���������������������d|d z���������������} | dk�����r%|���������������������d|d z���������������} | dk�����r|d z���} n| d z ��} |�j��������r2|�j��������s+|����������������������t����������||| �����������������������������������n|����������������������||| �����������������������|����������������������|| ������������}�n#�|d|������������r�t.�������������������������������||������������}|rq|�����������������������������������d d����������} |����������������������| �������������|�����������������������������������} �|d| d z ��������������s| d z ��} |����������������������|| ������������}���d||d�����������v�r9|����������������������|||d z��������������������������|����������������������||d z���������������}�nI�|d|�������������r5t6�������������������������������||������������}|rj|���������������������d ������������} |����������������������| �������������|�����������������������������������} �|d| d z ��������������s| d z ��} |����������������������|| ������������}��kt:�������������������������������||������������}|rX|rU|�����������������������������������||d�����������k����r5|�����������������������������������} | |k����r|} |����������������������||d z���������������}n@|d z���|k�����r/|����������������������d�������������|����������������������||d z���������������}nn||k�������|ry||k�����rs|�j��������sl|�j��������r2|�j��������s+|����������������������t����������|||�����������������������������������n|����������������������|||�����������������������|����������������������||������������}||d�����������|�_���������d�S�)Nr����<�&�"���z[\s;]z</�<!--z<?z<!r ���r���z&#��������;)r����lenr ���r����find�rfind�maxr'���r(����searchr����start�handle_datar���� updatepos� startswith�starttagopen�match�parse_starttag�parse_endtag� parse_comment�parse_pi�parse_html_declaration�charref�group�handle_charref�end� entityref�handle_entityref� incomplete)r���rJ���r����i�n�j�ampposrA���r?����k�names��� r ���r���zHTMLParser.goahead����s)������,�� ����L�L���!�e�e��$�� �T�_�� ��L�L��a�(�(���q�5�5��%�]�]�3��A�q��t���=�=�F��!����J�x�0�0�7�7���H�H��$���A���(�/�/���;�;�������� � �A�A�������A��1�u�u��(��3����3��$�$�X�g�a��c�l�%;�%;�<�<�<�<��$�$�W�Q�q�S�\�2�2�2����q�!�$�$�A��A�v�v�u� �+�J��z�#�q�!�!��J 6��%�%�g�q�1�1����+�+�A�.�.�A�A��Z��a�(�(����)�)�!�,�,�A�A��Z���*�*�� ��*�*�1�-�-�A�A��Z��a�(�(���� � �a�(�(�A�A��Z��a�(�(����3�3�A�6�6�A�A��!�e�q�[�[��$�$�S�)�)�)��A��A�A���q�5�5��������S�!�a�%�0�0�A��1�u�u�#�L�L��a�!�e�4�4���q�5�5� !�A��A���Q����,��7�T�_��7��(�(��'�!�A�#�,�)?�)?�@�@�@�@��(�(���1���6�6�6��N�N�1�a�(�(�����D�!�$�$��+ 6�� � �g�q�1�1����� �;�;�=�=��2��.�D��'�'��-�-�-�� � ���A�%�:�c�1�Q�3�/�/��"���E�����q�!�,�,�A���g�a�b�b�k�)�)��(�(���1�Q�3���8�8�8� �N�N�1�a��c�2�2�����C��#�#�� 6�!�����3�3����� �;�;�q�>�>�D��)�)�$�/�/�/�� � ���A�%�:�c�1�Q�3�/�/��"���E�����q�!�,�,�A��"�(�(��!�4�4�������5�u�{�{�}�}������;�;�!�I�I�K�K����6�6� !�A� �N�N�1�a�!�e�4�4����!�e�q�[�[���$�$�S�)�)�)����q�!�a�%�0�0�A�A��O��!�e�e�V��� %�1�q�5�5���5��$�� /�T�_�� /�� � ��'�!�A�#�,�!7�!7�8�8�8�8�� � ���1���.�.�.����q�!�$�$�A��q�r�r�{����r���c����������������������|�j���������}|||dz�������������dk����r|����������������������|������������S�|||dz�������������dk����r|����������������������|������������S�|||dz������������������������������������������������dk����rF|���������������������d|dz���������������}|dk����rdS�|����������������������||d z���|�����������������������|d z���S�|����������������������|������������S�)N����r3�������z<![� ���z <!doctyper���r5���r4���r ���)r���rD����parse_marked_sectionr&���r8����handle_decl�parse_bogus_comment)r���rN���r����gtposs��� r ���rF���z!HTMLParser.parse_html_declaration����s��������,����1�Q�q�S�5�>�V�#�#��%�%�a�(�(�(� �Q�q��s�U�^�u� $� $��,�,�Q�/�/�/� �Q�q��s�U�^� !� !� #� #�{� 2� 2��L�L��a��c�*�*�E���{�{��r����W�Q�q�S��Y�/�0�0�0���7�N��+�+�A�.�.�.r���r ���c�����������������������|�j���������}|���������������������d|dz���������������}|dk����rdS�|r |����������������������||dz���|�����������������������|dz���S�)Nr���r4���r5���r ���)r���r8����handle_comment)r���rN����reportr����poss��� r ���rZ���zHTMLParser.parse_bogus_comment��sb�������,����l�l�3��!��$�$���"�9�9��2��� 2������!��C�� 0�1�1�1��Q�w�r���c������������������������|�j���������}t�������������������������������||dz���������������}|sdS�|�����������������������������������}|����������������������||dz���|�����������������������|�����������������������������������}|S�)Nr4���r5���)r����picloser;���r<���� handle_pirJ���)r���rN���r���rA���rP���s��� r ���rE���zHTMLParser.parse_pi ��sj�������,�����w��!��,�,���� ��2��K�K�M�M�����w�q��s�A�v��'�'�'��I�I�K�K���r���c������������������>����d�|�_���������|����������������������|������������}|dk�����r|S�|�j��������}|||����������|�_���������g�}t�������������������������������||dz���������������}|�����������������������������������}|���������������������d�����������������������������������������������x|�_��������}||k�����r�t�������������������������������||������������}|sn�|���������������������ddd������������\��} } }| sd�}nI|d�d����������dcxk����r|dd�����������k����s"n�|d�d����������dcxk����r|dd�����������k����r n�n |dd����������}|rt����������|������������}|���������������������| �����������������������������������|f�������������|�����������������������������������}||k�������|||���������������������������������������������}|dvr|�� ��������������������|||�����������������������|S�|���������������������d ������������r|����������������������||�������������n4|����������������������||�������������||�j��������v�r|����������������������|�������������|S�) Nr���r ���r4���rV����'r5����")r����/>rf���)r#����check_for_whole_start_tagr����tagfind_tolerantrA���rJ���rH���r&���r����attrfind_tolerantr����append�stripr=����endswith�handle_startendtag�handle_starttag�CDATA_CONTENT_ELEMENTSr+���) r���rN����endposr����attrsrA���rR����tag�m�attrname�rest� attrvaluerJ���s ��� r ���rB���zHTMLParser.parse_starttag,��sU�����#����/�/��2�2���A�:�:��M��,��&�q��x�0������ �&�&�w��!��4�4���I�I�K�K��"�[�[��^�^�1�1�3�3�3���s��&�j�j�!�'�'���3�3�A��� ��()����1�a�(8�(8�%�H�d�I��� ,� � � ��2�A�2��$�8�8�8�8�)�B�C�C�.�8�8�8�8��2�A�2��#�7�7�7�7��2�3�3��7�7�7�7�7�%�a��d�O� ��� 0�$�Y�/�/� ��L�L�(�.�.�*�*�I�6�7�7�7������A���&�j�j���a��h��%�%�'�'���k�!�!����W�Q�v�X�.�/�/�/��M��<�<����� )��#�#�C��/�/�/�/�� � ��e�,�,�,��d�1�1�1��#�#�C�(�(�(�� r���c����������������������|�j���������}t�������������������������������||������������}|r�|�����������������������������������}|||dz�������������}|dk����r|dz���S�|dk����r@|���������������������d|������������r|dz���S�|���������������������d|������������rdS�||k����r|S�|dz���S�|dk����rdS�|dv�rdS�||k����r|S�|dz���S�t����������d �������������) Nr ���r����/rf���r4���r5���r���z6abcdefghijklmnopqrstuvwxyz=/ABCDEFGHIJKLMNOPQRSTUVWXYZzwe should not get here!)r����locatestarttagend_tolerantrA���rJ���r?����AssertionError)r���rN���r���rs���rP����nexts��� r ���rg���z$HTMLParser.check_for_whole_start_tagX��s������,��&�,�,�W�a�8�8���� ������A��1�Q�q�S�5�>�D��s�{�{��1�u���s�{�{��%�%�d�A�.�.��!��q�5�L��%�%�c�1�-�-����2��q�5�5��H��q�5�L��r�z�z��r���5��6��6���r��1�u�u����1�u���6�7�7�7r���c������������������p����|�j���������}t�������������������������������||dz���������������}|sdS�|�����������������������������������}t�������������������������������||������������}|s�|�j���������|����������������������|||�����������������������|S�t�������������������������������||dz���������������}|s+|||dz�������������dk����r|dz���S�|�� ��������������������|������������S�|� ��������������������d�����������������������������������������������}|���������������������d|�����������������������������������������������}|�� ��������������������|�������������|dz���S�|� ��������������������d�����������������������������������������������}|�j���������*||�j��������k����r|����������������������|||�����������������������|S�|�� ��������������������|�������������|�������������������������������������|S�)Nr ���r5���r4���rV���z</>r���)r���� endendtagr;���rJ���� endtagfindrA���r���r=���rh���rZ���rH���r&���r8���� handle_endtagr.���)r���rN���r���rA���r[���� namematch�tagnamer*���s��� r ���rC���zHTMLParser.parse_endtagz��s�������,��� � ��!�A�#�.�.���� ��2�� � ����� � ��!�,�,���� ���*�� � ���5��!1�2�2�2���(�.�.�w��!��<�<�I��� 7��1�Q�q�S�5�>�U�*�*��Q�3�J��3�3�A�6�6�6��o�o�a�(�(�.�.�0�0�G� ��L�L��i�m�m�o�o�6�6�E����w�'�'�'���7�N��{�{�1�~�~�#�#�%�%���?�&��t��&�&�� � ���5��!1�2�2�2������4� � � ��������r���c������������������\�����|�����������������������||�������������|����������������������|�������������d�S�r-���)rn���r����r���rr���rq���s��� r ���rm���zHTMLParser.handle_startendtag���s2���������S�%�(�(�(����3�����r���c�����������������������d�S�r-�����r����s��� r ���rn���zHTMLParser.handle_starttag�����������r���c�����������������������d�S�r-���r����)r���rr���s��� r ���r���zHTMLParser.handle_endtag���r����r���c�����������������������d�S�r-���r�����r���rS���s��� r ���rI���zHTMLParser.handle_charref���r����r���c�����������������������d�S�r-���r����r����s��� r ���rL���zHTMLParser.handle_entityref���r����r���c�����������������������d�S�r-���r����r���s��� r ���r=���zHTMLParser.handle_data���r����r���c�����������������������d�S�r-���r����r���s��� r ���r]���zHTMLParser.handle_comment���r����r���c�����������������������d�S�r-���r����)r����decls��� r ���rY���zHTMLParser.handle_decl���r����r���c�����������������������d�S�r-���r����r���s��� r ���rb���zHTMLParser.handle_pi���r����r���c�����������������������d�S�r-���r����r���s��� r ����unknown_declzHTMLParser.unknown_decl���r����r���)r ���)�__name__� __module__�__qualname__�__doc__ro���r���r���r���r!���r#���r$���r+���r.���r���rF���rZ���rE���rB���rg���rC���rm���rn���r���rI���rL���r=���r]���rY���rb���r����r����r���r ���r���r���>���s�����������������*�1��+/�����������+��+��+�������������O�$��$��$�N��N��N������u#��u#��u#�t/��/��/�* �� �� �� � �� �� �(��(��(�X8��8��8�D%��%��%�P �� �� � �� �� � �� �� � �� �� � �� �� � �� �� � �� �� � �� �� � �� �� � �� �� �� �� r���)r����r'���r����htmlr����__all__r(���r���rM���rK���rG���r@���ra����commentcloserh���ri����VERBOSEry���r}���r~���r���r���r����r���r ����<module>r�������sm�����"��"�� � � � �����������������������.��� �R�Z��'�'��� �R�Z�� %� %� ��B�J�>�?�?� � �"�*�@� A� A���r�z�+�&�&�� �"�*�S�/�/���r�z�)�$�$����2�:�L�M�M����B�J�=�>��>����(�R�Z��)���Z������� �B�J�s�O�O� ���R�Z�>� ?� ?� �I ��I ��I ��I ��I ��'��I ��I ��I ��I ��I r���