kopia lustrzana https://github.com/micropython/micropython
py/objstr: Optimise mp_obj_new_str_from_vstr for known-safe strings.
The new `mp_obj_new_str_from_utf8_vstr` can be used when you know you already have a unicode-safe string. Signed-off-by: Jim Mussared <jim.mussared@gmail.com>pull/6044/merge
rodzic
88864587f5
commit
3a910b1565
|
@ -67,7 +67,7 @@ STATIC mp_obj_t mod_ujson_dump_helper(size_t n_args, const mp_obj_t *pos_args, m
|
||||||
vstr_t vstr;
|
vstr_t vstr;
|
||||||
vstr_init_print(&vstr, 8, &print_ext.base);
|
vstr_init_print(&vstr, 8, &print_ext.base);
|
||||||
mp_obj_print_helper(&print_ext.base, pos_args[0], PRINT_JSON);
|
mp_obj_print_helper(&print_ext.base, pos_args[0], PRINT_JSON);
|
||||||
return mp_obj_new_str_from_vstr(&vstr);
|
return mp_obj_new_str_from_utf8_vstr(&vstr);
|
||||||
} else {
|
} else {
|
||||||
// dump(obj, stream)
|
// dump(obj, stream)
|
||||||
print_ext.base.data = MP_OBJ_TO_PTR(pos_args[1]);
|
print_ext.base.data = MP_OBJ_TO_PTR(pos_args[1]);
|
||||||
|
@ -103,7 +103,7 @@ STATIC mp_obj_t mod_ujson_dumps(mp_obj_t obj) {
|
||||||
mp_print_t print;
|
mp_print_t print;
|
||||||
vstr_init_print(&vstr, 8, &print);
|
vstr_init_print(&vstr, 8, &print);
|
||||||
mp_obj_print_helper(&print, obj, PRINT_JSON);
|
mp_obj_print_helper(&print, obj, PRINT_JSON);
|
||||||
return mp_obj_new_str_from_vstr(&vstr);
|
return mp_obj_new_str_from_utf8_vstr(&vstr);
|
||||||
}
|
}
|
||||||
STATIC MP_DEFINE_CONST_FUN_OBJ_1(mod_ujson_dumps_obj, mod_ujson_dumps);
|
STATIC MP_DEFINE_CONST_FUN_OBJ_1(mod_ujson_dumps_obj, mod_ujson_dumps);
|
||||||
|
|
||||||
|
|
|
@ -373,7 +373,7 @@ STATIC mp_obj_t re_sub_helper(size_t n_args, const mp_obj_t *args) {
|
||||||
vstr_add_strn(&vstr_return, subj.begin, subj.end - subj.begin);
|
vstr_add_strn(&vstr_return, subj.begin, subj.end - subj.begin);
|
||||||
|
|
||||||
if (mp_obj_get_type(where) == &mp_type_str) {
|
if (mp_obj_get_type(where) == &mp_type_str) {
|
||||||
return mp_obj_new_str_from_vstr(&vstr_return);
|
return mp_obj_new_str_from_utf8_vstr(&vstr_return);
|
||||||
} else {
|
} else {
|
||||||
return mp_obj_new_bytes_from_vstr(&vstr_return);
|
return mp_obj_new_bytes_from_vstr(&vstr_return);
|
||||||
}
|
}
|
||||||
|
|
|
@ -559,7 +559,7 @@ STATIC mp_obj_t mod_socket_inet_ntop(mp_obj_t family_in, mp_obj_t binaddr_in) {
|
||||||
mp_raise_OSError(errno);
|
mp_raise_OSError(errno);
|
||||||
}
|
}
|
||||||
vstr.len = strlen(vstr.buf);
|
vstr.len = strlen(vstr.buf);
|
||||||
return mp_obj_new_str_from_vstr(&vstr);
|
return mp_obj_new_str_from_utf8_vstr(&vstr);
|
||||||
}
|
}
|
||||||
STATIC MP_DEFINE_CONST_FUN_OBJ_2(mod_socket_inet_ntop_obj, mod_socket_inet_ntop);
|
STATIC MP_DEFINE_CONST_FUN_OBJ_2(mod_socket_inet_ntop_obj, mod_socket_inet_ntop);
|
||||||
|
|
||||||
|
|
|
@ -467,7 +467,7 @@ STATIC mp_obj_t mp_builtin_repr(mp_obj_t o_in) {
|
||||||
mp_print_t print;
|
mp_print_t print;
|
||||||
vstr_init_print(&vstr, 16, &print);
|
vstr_init_print(&vstr, 16, &print);
|
||||||
mp_obj_print_helper(&print, o_in, PRINT_REPR);
|
mp_obj_print_helper(&print, o_in, PRINT_REPR);
|
||||||
return mp_obj_new_str_from_vstr(&vstr);
|
return mp_obj_new_str_from_utf8_vstr(&vstr);
|
||||||
}
|
}
|
||||||
MP_DEFINE_CONST_FUN_OBJ_1(mp_builtin_repr_obj, mp_builtin_repr);
|
MP_DEFINE_CONST_FUN_OBJ_1(mp_builtin_repr_obj, mp_builtin_repr);
|
||||||
|
|
||||||
|
|
5
py/obj.h
5
py/obj.h
|
@ -792,6 +792,11 @@ mp_obj_t mp_obj_new_int_from_ull(unsigned long long val); // this must return a
|
||||||
mp_obj_t mp_obj_new_str(const char *data, size_t len);
|
mp_obj_t mp_obj_new_str(const char *data, size_t len);
|
||||||
mp_obj_t mp_obj_new_str_via_qstr(const char *data, size_t len);
|
mp_obj_t mp_obj_new_str_via_qstr(const char *data, size_t len);
|
||||||
mp_obj_t mp_obj_new_str_from_vstr(vstr_t *vstr);
|
mp_obj_t mp_obj_new_str_from_vstr(vstr_t *vstr);
|
||||||
|
#if MICROPY_PY_BUILTINS_STR_UNICODE && MICROPY_PY_BUILTINS_STR_UNICODE_CHECK
|
||||||
|
mp_obj_t mp_obj_new_str_from_utf8_vstr(vstr_t *vstr); // only use when vstr is already known to be utf-8 encoded
|
||||||
|
#else
|
||||||
|
#define mp_obj_new_str_from_utf8_vstr mp_obj_new_str_from_vstr
|
||||||
|
#endif
|
||||||
mp_obj_t mp_obj_new_bytes_from_vstr(vstr_t *vstr);
|
mp_obj_t mp_obj_new_bytes_from_vstr(vstr_t *vstr);
|
||||||
mp_obj_t mp_obj_new_bytes(const byte *data, size_t len);
|
mp_obj_t mp_obj_new_bytes(const byte *data, size_t len);
|
||||||
mp_obj_t mp_obj_new_bytearray(size_t n, const void *items);
|
mp_obj_t mp_obj_new_bytearray(size_t n, const void *items);
|
||||||
|
|
|
@ -2256,6 +2256,13 @@ mp_obj_t mp_obj_new_str_from_vstr(vstr_t *vstr) {
|
||||||
return mp_obj_new_str_type_from_vstr(&mp_type_str, vstr);
|
return mp_obj_new_str_type_from_vstr(&mp_type_str, vstr);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if MICROPY_PY_BUILTINS_STR_UNICODE && MICROPY_PY_BUILTINS_STR_UNICODE_CHECK
|
||||||
|
mp_obj_t mp_obj_new_str_from_utf8_vstr(vstr_t *vstr) {
|
||||||
|
// bypasses utf8_check.
|
||||||
|
return mp_obj_new_str_type_from_vstr(&mp_type_str, vstr);
|
||||||
|
}
|
||||||
|
#endif // MICROPY_PY_BUILTINS_STR_UNICODE && MICROPY_PY_BUILTINS_STR_UNICODE_CHECK
|
||||||
|
|
||||||
mp_obj_t mp_obj_new_bytes_from_vstr(vstr_t *vstr) {
|
mp_obj_t mp_obj_new_bytes_from_vstr(vstr_t *vstr) {
|
||||||
return mp_obj_new_str_type_from_vstr(&mp_type_bytes, vstr);
|
return mp_obj_new_str_type_from_vstr(&mp_type_bytes, vstr);
|
||||||
}
|
}
|
||||||
|
|
|
@ -160,7 +160,7 @@ value_error:
|
||||||
mp_printf(&print, "invalid syntax for integer with base %d: ", base);
|
mp_printf(&print, "invalid syntax for integer with base %d: ", base);
|
||||||
mp_str_print_quoted(&print, str_val_start, top - str_val_start, true);
|
mp_str_print_quoted(&print, str_val_start, top - str_val_start, true);
|
||||||
mp_obj_t exc = mp_obj_new_exception_arg1(&mp_type_ValueError,
|
mp_obj_t exc = mp_obj_new_exception_arg1(&mp_type_ValueError,
|
||||||
mp_obj_new_str_from_vstr(&vstr));
|
mp_obj_new_str_from_utf8_vstr(&vstr));
|
||||||
raise_exc(exc, lex);
|
raise_exc(exc, lex);
|
||||||
#endif
|
#endif
|
||||||
}
|
}
|
||||||
|
|
|
@ -203,7 +203,7 @@ STATIC mp_obj_t load_obj(mp_reader_t *reader) {
|
||||||
if (obj_type == MP_PERSISTENT_OBJ_STR || obj_type == MP_PERSISTENT_OBJ_BYTES) {
|
if (obj_type == MP_PERSISTENT_OBJ_STR || obj_type == MP_PERSISTENT_OBJ_BYTES) {
|
||||||
read_byte(reader); // skip null terminator
|
read_byte(reader); // skip null terminator
|
||||||
if (obj_type == MP_PERSISTENT_OBJ_STR) {
|
if (obj_type == MP_PERSISTENT_OBJ_STR) {
|
||||||
return mp_obj_new_str_from_vstr(&vstr);
|
return mp_obj_new_str_from_utf8_vstr(&vstr);
|
||||||
} else {
|
} else {
|
||||||
return mp_obj_new_bytes_from_vstr(&vstr);
|
return mp_obj_new_bytes_from_vstr(&vstr);
|
||||||
}
|
}
|
||||||
|
|
Ładowanie…
Reference in New Issue