LCOV - code coverage report
Current view: top level - home/jas/src/libidn2 - context.c (source / functions) Hit Total Coverage
Test: libidn2 Lines: 79 83 95.2 %
Date: 2014-06-25 Functions: 3 3 100.0 %
Legend: Lines: hit not hit | Branches: + taken - not taken # not executed Branches: 77 90 85.6 %

           Branch data     Line data    Source code
       1                 :            : /* context.c - check contextual rule on label
       2                 :            :    Copyright (C) 2011-2014 Simon Josefsson
       3                 :            : 
       4                 :            :    Libidn2 is free software: you can redistribute it and/or modify it
       5                 :            :    under the terms of either:
       6                 :            : 
       7                 :            :      * the GNU Lesser General Public License as published by the Free
       8                 :            :        Software Foundation; either version 3 of the License, or (at
       9                 :            :        your option) any later version.
      10                 :            : 
      11                 :            :    or
      12                 :            : 
      13                 :            :      * the GNU General Public License as published by the Free
      14                 :            :        Software Foundation; either version 2 of the License, or (at
      15                 :            :        your option) any later version.
      16                 :            : 
      17                 :            :    or both in parallel, as here.
      18                 :            : 
      19                 :            :    This program is distributed in the hope that it will be useful,
      20                 :            :    but WITHOUT ANY WARRANTY; without even the implied warranty of
      21                 :            :    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
      22                 :            :    GNU General Public License for more details.
      23                 :            : 
      24                 :            :    You should have received copies of the GNU General Public License and
      25                 :            :    the GNU Lesser General Public License along with this program.  If
      26                 :            :    not, see <http://www.gnu.org/licenses/>.
      27                 :            : */
      28                 :            : 
      29                 :            : #include <config.h>
      30                 :            : 
      31                 :            : #include "idn2.h"
      32                 :            : 
      33                 :            : #include "tables.h"
      34                 :            : 
      35                 :            : #include <unictype.h>             /* uc_combining_class, UC_CCC_VR */
      36                 :            : 
      37                 :            : #include "context.h"
      38                 :            : 
      39                 :            : int
      40                 :       2635 : _idn2_contextj_rule (const uint32_t * label, size_t llen, size_t pos)
      41                 :            : {
      42                 :            :   uint32_t cp;
      43                 :            : 
      44         [ -  + ]:       2635 :   if (llen == 0)
      45                 :          0 :     return IDN2_OK;
      46                 :            : 
      47                 :       2635 :   cp = label[pos];
      48                 :            : 
      49         [ +  + ]:       2635 :   if (!_idn2_contextj_p (cp))
      50                 :       2603 :     return IDN2_OK;
      51                 :            : 
      52      [ +  +  - ]:         32 :   switch (cp)
      53                 :            :     {
      54                 :            :     case 0x200C:                /* ZERO WIDTH NON-JOINER */
      55         [ +  + ]:         21 :       if (pos > 0)
      56                 :            :         {
      57                 :            :           /* If Canonical_Combining_Class(Before(cp)) .eq.  Virama Then True; */
      58                 :         20 :           uint32_t before_cp = label[pos - 1];
      59                 :         20 :           int cc = uc_combining_class (before_cp);
      60         [ +  + ]:         20 :           if (cc == UC_CCC_VR)
      61                 :          3 :             return IDN2_OK;
      62                 :            :         }
      63                 :            : 
      64                 :            :       /* See http://permalink.gmane.org/gmane.ietf.idnabis/6980 for
      65                 :            :          clarified rule. */
      66                 :            : 
      67 [ +  + ][ -  + ]:         18 :       if (pos == 0 || pos == llen - 1)
      68                 :          1 :         return IDN2_CONTEXTJ;
      69                 :            : 
      70                 :            :       {
      71                 :            :         int jt;
      72                 :            :         size_t tmp;
      73                 :            : 
      74                 :            :         /* Search backwards. */
      75                 :         17 :         for (tmp = pos - 1;; tmp--)
      76                 :            :           {
      77                 :         22 :             jt = uc_joining_type (label[tmp]);
      78 [ +  - ][ +  + ]:         22 :             if (jt == UC_JOINING_TYPE_L || jt == UC_JOINING_TYPE_D)
      79                 :            :               break;
      80         [ -  + ]:          7 :             if (tmp == 0)
      81                 :          0 :               return IDN2_CONTEXTJ;
      82         [ +  + ]:          7 :             if (jt == UC_JOINING_TYPE_T)
      83                 :          5 :               continue;
      84                 :          2 :             return IDN2_CONTEXTJ;
      85                 :          5 :           }
      86                 :            : 
      87                 :            :         /* Search forward. */
      88         [ +  - ]:         22 :         for (tmp = pos + 1; tmp < llen; tmp++)
      89                 :            :           {
      90                 :         22 :             jt = uc_joining_type (label[tmp]);
      91 [ +  + ][ +  + ]:         22 :             if (jt == UC_JOINING_TYPE_R || jt == UC_JOINING_TYPE_D)
      92                 :            :               break;
      93         [ +  + ]:          8 :             if (tmp == llen - 1)
      94                 :          1 :               return IDN2_CONTEXTJ;
      95         [ +  - ]:          7 :             if (jt == UC_JOINING_TYPE_T)
      96                 :          7 :               continue;
      97                 :          0 :             return IDN2_CONTEXTJ;
      98                 :            :           }
      99                 :            :       }
     100                 :            : 
     101                 :         14 :       return IDN2_OK;
     102                 :            :       break;
     103                 :            : 
     104                 :            :     case 0x200D:                /* ZERO WIDTH JOINER */
     105         [ +  + ]:         11 :       if (pos > 0)
     106                 :            :         {
     107                 :         10 :           uint32_t before_cp = label[pos - 1];
     108                 :         10 :           int cc = uc_combining_class (before_cp);
     109         [ +  + ]:         10 :           if (cc == UC_CCC_VR)
     110                 :          9 :             return IDN2_OK;
     111                 :            :         }
     112                 :          2 :       return IDN2_CONTEXTJ;
     113                 :            :     }
     114                 :            : 
     115                 :       2635 :   return IDN2_CONTEXTJ_NO_RULE;
     116                 :            : }
     117                 :            : 
     118                 :            : int
     119                 :        153 : _idn2_contexto_rule (const uint32_t * label, size_t llen, size_t pos)
     120                 :            : {
     121                 :        153 :   uint32_t cp = label[pos];
     122                 :            : 
     123         [ +  + ]:        153 :   if (!_idn2_contexto_p (cp))
     124                 :        112 :     return IDN2_OK;
     125                 :            : 
     126   [ +  +  +  +  :         41 :   switch (cp)
                +  +  - ]
     127                 :            :     {
     128                 :            :     case 0x00B7:
     129                 :            :       /* MIDDLE DOT */
     130         [ +  + ]:          6 :       if (llen < 3)
     131                 :          3 :         return IDN2_CONTEXTO;
     132 [ +  - ][ -  + ]:          3 :       if (pos == 0 || pos == llen - 1)
     133                 :          0 :         return IDN2_CONTEXTO;
     134 [ +  + ][ +  - ]:          3 :       if (label[pos - 1] == 0x006C && label[pos + 1] == 0x006C)
     135                 :          2 :         return IDN2_OK;
     136                 :          1 :       return IDN2_CONTEXTO;
     137                 :            :       break;
     138                 :            : 
     139                 :            :     case 0x0375:
     140                 :            :       /* GREEK LOWER NUMERAL SIGN (KERAIA) */
     141         [ +  + ]:          8 :       if (pos == llen - 1)
     142                 :          1 :         return IDN2_CONTEXTO;
     143         [ +  + ]:          7 :       if (strcmp (uc_script (label[pos + 1])->name, "Greek") == 0)
     144                 :          4 :         return IDN2_OK;
     145                 :          3 :       return IDN2_CONTEXTO;
     146                 :            :       break;
     147                 :            : 
     148                 :            :     case 0x05F3:
     149                 :            :       /* HEBREW PUNCTUATION GERESH */
     150                 :            :     case 0x05F4:
     151                 :            :       /* HEBREW PUNCTUATION GERSHAYIM */
     152         [ +  + ]:         12 :       if (pos == 0)
     153                 :          2 :         return IDN2_CONTEXTO;
     154         [ +  + ]:         10 :       if (strcmp (uc_script (label[pos - 1])->name, "Hebrew") == 0)
     155                 :          5 :         return IDN2_OK;
     156                 :          5 :       return IDN2_CONTEXTO;
     157                 :            :       break;
     158                 :            : 
     159                 :            :     case 0x0660:
     160                 :            :     case 0x0661:
     161                 :            :     case 0x0662:
     162                 :            :     case 0x0663:
     163                 :            :     case 0x0664:
     164                 :            :     case 0x0665:
     165                 :            :     case 0x0666:
     166                 :            :     case 0x0667:
     167                 :            :     case 0x0668:
     168                 :            :     case 0x0669:
     169                 :            :       {
     170                 :            :         /* ARABIC-INDIC DIGITS */
     171                 :            :         size_t i;
     172         [ +  + ]:         21 :         for (i = 0; i < llen; i++)
     173 [ +  + ][ +  - ]:         18 :           if (label[i] >= 0x6F0 && label[i] <= 0x06F9)
     174                 :          3 :             return IDN2_CONTEXTO;
     175                 :          3 :         return IDN2_OK;
     176                 :            :         break;
     177                 :            :       }
     178                 :            : 
     179                 :            :     case 0x06F0:
     180                 :            :     case 0x06F1:
     181                 :            :     case 0x06F2:
     182                 :            :     case 0x06F3:
     183                 :            :     case 0x06F4:
     184                 :            :     case 0x06F5:
     185                 :            :     case 0x06F6:
     186                 :            :     case 0x06F7:
     187                 :            :     case 0x06F8:
     188                 :            :     case 0x06F9:
     189                 :            :       {
     190                 :            :         /* EXTENDED ARABIC-INDIC DIGITS */
     191                 :            :         size_t i;
     192         [ +  + ]:          8 :         for (i = 0; i < llen; i++)
     193 [ +  + ][ +  + ]:          7 :           if (label[i] >= 0x660 && label[i] <= 0x0669)
     194                 :          1 :             return IDN2_CONTEXTO;
     195                 :          1 :         return IDN2_OK;
     196                 :            :         break;
     197                 :            :       }
     198                 :            :     case 0x30FB:
     199                 :            :       {
     200                 :            :         /* KATAKANA MIDDLE DOT */
     201                 :            :         size_t i;
     202                 :          7 :         bool script_ok = false;
     203                 :            : 
     204 [ +  + ][ +  + ]:         51 :         for (i = 0; !script_ok && i < llen; i++)
     205         [ +  + ]:         44 :           if (strcmp (uc_script (label[i])->name, "Hiragana") == 0
     206         [ +  + ]:         43 :               || strcmp (uc_script (label[i])->name, "Katakana") == 0
     207         [ +  + ]:         42 :               || strcmp (uc_script (label[i])->name, "Han") == 0)
     208                 :          4 :             script_ok = true;
     209                 :            : 
     210         [ +  + ]:          7 :         if (script_ok)
     211                 :          4 :           return IDN2_OK;
     212                 :          3 :         return IDN2_CONTEXTO;
     213                 :            :         break;
     214                 :            :       }
     215                 :            :     }
     216                 :            : 
     217                 :        153 :   return IDN2_CONTEXTO_NO_RULE;
     218                 :            : }
     219                 :            : 
     220                 :            : bool
     221                 :         26 : _idn2_contexto_with_rule (uint32_t cp)
     222                 :            : {
     223         [ +  - ]:         26 :   switch (cp)
     224                 :            :     {
     225                 :            :     case 0x00B7:
     226                 :            :       /* MIDDLE DOT */
     227                 :            :     case 0x0375:
     228                 :            :       /* GREEK LOWER NUMERAL SIGN (KERAIA) */
     229                 :            :     case 0x05F3:
     230                 :            :       /* HEBREW PUNCTUATION GERESH */
     231                 :            :     case 0x05F4:
     232                 :            :       /* HEBREW PUNCTUATION GERSHAYIM */
     233                 :            :     case 0x0660:
     234                 :            :     case 0x0661:
     235                 :            :     case 0x0662:
     236                 :            :     case 0x0663:
     237                 :            :     case 0x0664:
     238                 :            :     case 0x0665:
     239                 :            :     case 0x0666:
     240                 :            :     case 0x0667:
     241                 :            :     case 0x0668:
     242                 :            :     case 0x0669:
     243                 :            :       /* ARABIC-INDIC DIGITS */
     244                 :            :     case 0x06F0:
     245                 :            :     case 0x06F1:
     246                 :            :     case 0x06F2:
     247                 :            :     case 0x06F3:
     248                 :            :     case 0x06F4:
     249                 :            :     case 0x06F5:
     250                 :            :     case 0x06F6:
     251                 :            :     case 0x06F7:
     252                 :            :     case 0x06F8:
     253                 :            :     case 0x06F9:
     254                 :            :       /* EXTENDED ARABIC-INDIC DIGITS */
     255                 :            :     case 0x30FB:
     256                 :            :       /* KATAKANA MIDDLE DOT */
     257                 :         26 :       return true;
     258                 :            :       break;
     259                 :            :     }
     260                 :            : 
     261                 :         26 :   return false;
     262                 :            : }

Generated by: LCOV version 1.9