Dataset Viewer
Split (1)
train
The dataset viewer is not available for this split.
Cannot load the dataset split (in streaming mode) to extract the first rows.
Error code:   StreamingRowsError
Exception:    CastError
Message:      Couldn't cast
errors: list<item: null>
  child 0, item: null
infos: list<item: null>
  child 0, item: null
type: string
config: struct<baseline_path: string, target_path: string, start_step: int64, end_step: int64, diff_threshol (... 453 chars omitted)
  child 0, baseline_path: string
  child 1, target_path: string
  child 2, start_step: int64
  child 3, end_step: int64
  child 4, diff_threshold: double
  child 5, filter: null
  child 6, output_format: string
  child 7, verbosity: string
  child 8, preset: null
  child 9, grouping_skip_keys: list<item: string>
      child 0, item: string
  child 10, token_aligner: null
  child 11, tokenizer: null
  child 12, viz_bundle_details: bool
  child 13, viz_output_dir: string
  child 14, visualize_per_token: null
  child 15, override_dims: list<item: string>
      child 0, item: string
  child 16, override_baseline_dims: list<item: null>
      child 0, item: null
  child 17, override_target_dims: list<item: null>
      child 0, item: null
  child 18, override_config: null
  child 19, allow_skipped_pattern: string
  child 20, allow_failed_pattern: null
  child 21, report_path: null
location: struct<step: int64>
  child 0, step: int64
name: string
baseline: struct<shape: list<item: int64>, dtype: string, stats: struct<mean: double, abs_mean: double, std: d (... 126 chars omitted)
  child 0, shape: list<item: int64>
      child 0, item: int64
  child 1, dtype: string
  child 2, stats: struct<mean: double, abs_mean: double, std: double, min: double, ma
...
dtype: string, rank: int (... 206 chars omitted)
      child 0, num_files: int64
      child 1, files: list<item: struct<shape: list<item: int64>, dtype: string, rank: int64, parallel_info: struct<attn_c (... 159 chars omitted)
          child 0, item: struct<shape: list<item: int64>, dtype: string, rank: int64, parallel_info: struct<attn_cp: string,  (... 147 chars omitted)
              child 0, shape: list<item: int64>
                  child 0, item: int64
              child 1, dtype: string
              child 2, rank: int64
              child 3, parallel_info: struct<attn_cp: string, attn_dp: string, attn_tp: string, local_attn_dp: string, moe_dp: string, moe (... 52 chars omitted)
                  child 0, attn_cp: string
                  child 1, attn_dp: string
                  child 2, attn_tp: string
                  child 3, local_attn_dp: string
                  child 4, moe_dp: string
                  child 5, moe_ep: string
                  child 6, moe_tp: string
                  child 7, pp: string
                  child 8, tp: string
              child 4, filename: string
      child 2, dims: string
total: int64
passed: int64
failed: int64
skipped: int64
errored: int64
max_rel_diff: double
run_path: string
pass_label: string
num_layers_passed: int64
date: timestamp[s]
capture_signature: string
tp_size: int64
num_layers_compared: int64
model: string
num_layers_failed: int64
ci_run_id: string
sglang_commit: string
hardware: string
push_index: int64
to
{'date': Value('timestamp[s]'), 'model': Value('string'), 'run_path': Value('string'), 'sglang_commit': Value('string'), 'push_index': Value('int64'), 'hardware': Value('string'), 'tp_size': Value('int64'), 'pass_label': Value('string'), 'capture_signature': Value('string'), 'ci_run_id': Value('string'), 'num_layers_compared': Value('int64'), 'num_layers_passed': Value('int64'), 'num_layers_failed': Value('int64'), 'max_rel_diff': Value('float64')}
because column names don't match
Traceback:    Traceback (most recent call last):
                File "/src/services/worker/src/worker/utils.py", line 99, in get_rows_or_raise
                  return get_rows(
                         ^^^^^^^^^
                File "/src/libs/libcommon/src/libcommon/utils.py", line 272, in decorator
                  return func(*args, **kwargs)
                         ^^^^^^^^^^^^^^^^^^^^^
                File "/src/services/worker/src/worker/utils.py", line 77, in get_rows
                  rows_plus_one = list(itertools.islice(ds, rows_max_number + 1))
                                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/iterable_dataset.py", line 2690, in __iter__
                  for key, example in ex_iterable:
                                      ^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/iterable_dataset.py", line 2227, in __iter__
                  for key, pa_table in self._iter_arrow():
                                       ^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/iterable_dataset.py", line 2251, in _iter_arrow
                  for key, pa_table in self.ex_iterable._iter_arrow():
                                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/iterable_dataset.py", line 494, in _iter_arrow
                  for key, pa_table in iterator:
                                       ^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/iterable_dataset.py", line 384, in _iter_arrow
                  for key, pa_table in self.generate_tables_fn(**gen_kwags):
                                       ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/packaged_modules/json/json.py", line 299, in _generate_tables
                  self._cast_table(pa_table, json_field_paths=json_field_paths),
                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/packaged_modules/json/json.py", line 128, in _cast_table
                  pa_table = table_cast(pa_table, self.info.features.arrow_schema)
                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/table.py", line 2321, in table_cast
                  return cast_table_to_schema(table, schema)
                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "/usr/local/lib/python3.12/site-packages/datasets/table.py", line 2249, in cast_table_to_schema
                  raise CastError(
              datasets.table.CastError: Couldn't cast
              errors: list<item: null>
                child 0, item: null
              infos: list<item: null>
                child 0, item: null
              type: string
              config: struct<baseline_path: string, target_path: string, start_step: int64, end_step: int64, diff_threshol (... 453 chars omitted)
                child 0, baseline_path: string
                child 1, target_path: string
                child 2, start_step: int64
                child 3, end_step: int64
                child 4, diff_threshold: double
                child 5, filter: null
                child 6, output_format: string
                child 7, verbosity: string
                child 8, preset: null
                child 9, grouping_skip_keys: list<item: string>
                    child 0, item: string
                child 10, token_aligner: null
                child 11, tokenizer: null
                child 12, viz_bundle_details: bool
                child 13, viz_output_dir: string
                child 14, visualize_per_token: null
                child 15, override_dims: list<item: string>
                    child 0, item: string
                child 16, override_baseline_dims: list<item: null>
                    child 0, item: null
                child 17, override_target_dims: list<item: null>
                    child 0, item: null
                child 18, override_config: null
                child 19, allow_skipped_pattern: string
                child 20, allow_failed_pattern: null
                child 21, report_path: null
              location: struct<step: int64>
                child 0, step: int64
              name: string
              baseline: struct<shape: list<item: int64>, dtype: string, stats: struct<mean: double, abs_mean: double, std: d (... 126 chars omitted)
                child 0, shape: list<item: int64>
                    child 0, item: int64
                child 1, dtype: string
                child 2, stats: struct<mean: double, abs_mean: double, std: double, min: double, ma
              ...
              dtype: string, rank: int (... 206 chars omitted)
                    child 0, num_files: int64
                    child 1, files: list<item: struct<shape: list<item: int64>, dtype: string, rank: int64, parallel_info: struct<attn_c (... 159 chars omitted)
                        child 0, item: struct<shape: list<item: int64>, dtype: string, rank: int64, parallel_info: struct<attn_cp: string,  (... 147 chars omitted)
                            child 0, shape: list<item: int64>
                                child 0, item: int64
                            child 1, dtype: string
                            child 2, rank: int64
                            child 3, parallel_info: struct<attn_cp: string, attn_dp: string, attn_tp: string, local_attn_dp: string, moe_dp: string, moe (... 52 chars omitted)
                                child 0, attn_cp: string
                                child 1, attn_dp: string
                                child 2, attn_tp: string
                                child 3, local_attn_dp: string
                                child 4, moe_dp: string
                                child 5, moe_ep: string
                                child 6, moe_tp: string
                                child 7, pp: string
                                child 8, tp: string
                            child 4, filename: string
                    child 2, dims: string
              total: int64
              passed: int64
              failed: int64
              skipped: int64
              errored: int64
              max_rel_diff: double
              run_path: string
              pass_label: string
              num_layers_passed: int64
              date: timestamp[s]
              capture_signature: string
              tp_size: int64
              num_layers_compared: int64
              model: string
              num_layers_failed: int64
              ci_run_id: string
              sglang_commit: string
              hardware: string
              push_index: int64
              to
              {'date': Value('timestamp[s]'), 'model': Value('string'), 'run_path': Value('string'), 'sglang_commit': Value('string'), 'push_index': Value('int64'), 'hardware': Value('string'), 'tp_size': Value('int64'), 'pass_label': Value('string'), 'capture_signature': Value('string'), 'ci_run_id': Value('string'), 'num_layers_compared': Value('int64'), 'num_layers_passed': Value('int64'), 'num_layers_failed': Value('int64'), 'max_rel_diff': Value('float64')}
              because column names don't match
Need help to make the dataset viewer work? Make sure to review how to configure the dataset viewer, and open a discussion for direct support.
No dataset card yet
Downloads last month: 281
Total file size:
42.7 MB